Biology

Abgleich von synchronisierten Zeitreihendaten unter Verwendung des Modells zur Charakterisierung des Zellzyklusverlusts für experimentübergreifende Vergleiche

Published: June 9, 2023 doi: 10.3791/65466

Sophia A. Campione¹, Christina M. Kelliher², David A. Orlando³, Trung Q. Tran⁴, Steven B. Haase¹

¹Department of Biology, Duke University, ²Department of Biology, University of Massachusetts, ³Orlando Data Science LLC, ⁴Department of Computer Science, Duke University

Summary

Eine Herausforderung bei der Analyse synchronisierter Zeitreihenexperimente besteht darin, dass sich die Experimente oft in der Dauer der Erholung von der Synchronität und der Zellzyklusperiode unterscheiden. Daher können die Messungen aus verschiedenen Experimenten nicht aggregiert analysiert oder ohne weiteres verglichen werden. Hier beschreiben wir eine Methode zur Ausrichtung von Experimenten, um phasenspezifische Vergleiche zu ermöglichen.

Abstract

Die Untersuchung des Zellzyklus hängt oft von der Synchronisierung von Zellpopulationen ab, um verschiedene Parameter in einer Zeitreihe zu messen, während die Zellen den Zellzyklus durchlaufen. Aber auch unter ähnlichen Bedingungen zeigen Replikationsexperimente Unterschiede in der Zeit, die benötigt wird, um sich von der Synchronität zu erholen und den Zellzyklus zu durchlaufen, wodurch direkte Vergleiche zu jedem Zeitpunkt verhindert werden. Das Problem des Vergleichs dynamischer Messungen in verschiedenen Experimenten wird in mutierten Populationen oder unter alternativen Wachstumsbedingungen, die sich auf die synchrone Erholungszeit und/oder die Zellzykluszeit auswirken, noch verschärft.

Wir haben bereits ein parametrisches mathematisches Modell mit dem Namen Characterizing Loss of Cell Cycle Synchrony (CLOCCS) veröffentlicht, das überwacht, wie sich synchrone Zellpopulationen aus der Synchronität lösen und den Zellzyklus durchlaufen. Die gelernten Parameter aus dem Modell können dann verwendet werden, um experimentelle Zeitpunkte aus synchronisierten Zeitreihenexperimenten in eine normalisierte Zeitskala (Lebenslinienpunkte) umzuwandeln. Anstatt die verstrichene Zeit in Minuten seit Beginn des Experiments darzustellen, stellt die Lebenslinienskala den Verlauf von der Synchronität zum Eintritt in den Zellzyklus und dann durch die Phasen des Zellzyklus dar. Da die Lebenslinienpunkte der Phase der durchschnittlichen Zelle innerhalb der synchronisierten Population entsprechen, ermöglicht diese normalisierte Zeitskala direkte Vergleiche zwischen Experimenten, einschließlich solcher mit unterschiedlichen Zeiträumen und Erholungszeiten. Darüber hinaus wurde das Modell verwendet, um Zellzyklusexperimente zwischen verschiedenen Arten (z.B. Saccharomyces cerevisiae und Schizosaccharomyces pombe) aufeinander abzustimmen, wodurch ein direkter Vergleich von Zellzyklusmessungen ermöglicht wird, die evolutionäre Ähnlichkeiten und Unterschiede aufzeigen können.

Introduction

Zeitreihenmessungen an synchronisierten Zellpopulationen auf ihrem Weg durch den Zellzyklus sind eine Standardmethode zur Untersuchung der Mechanismen, die das Fortschreiten des Zellzyklus steuern 1,2,3,4,5,6,7,8 . Die Fähigkeit, Vergleiche zwischen Synchronie-/Release-Zeitreihenexperimenten anzustellen, ist für unser Verständnis dieser dynamischen Prozesse von entscheidender Bedeutung. Die Verwendung von Wiederholungsexperimenten zur Bestätigung der Ergebnisse kann das Vertrauen in die Reproduzierbarkeit der Schlussfolgerungen erhöhen. Darüber hinaus können Vergleiche zwischen Umweltbedingungen, Mutanten und sogar zwischen Spezies viele neue Erkenntnisse über die Regulation des Zellzyklus liefern. Die interexperimentelle Variabilität in der Erholung von der Synchronität und in der Geschwindigkeit des Zellzyklusfortschritts beeinträchtigt jedoch die Fähigkeit, Zeitpunkt-zu-Zeitpunkt-Vergleiche zwischen Replikaten oder zwischen Experimenten mit verändertem Zellzyklus-Timing anzustellen. Aufgrund dieser Herausforderungen werden Replikate oft nicht für die gesamte Zeitreihe einbezogen (z. B. Spellman et ^al.4). Wenn Replikationen für die gesamte Zeitreihe gesammelt werden, können die Daten nicht aggregiert analysiert werden, sondern es wird ein einzelnes Replikat für die Analyse verwendet, und andere Replikate werden oft auf zusätzliche Zahlen verwiesen (z. B. Orlando et ^al.8). Darüber hinaus sind Vergleiche zwischen Experimenten mit unterschiedlichen Erholungs- oder Zellzyklus-Progressionsmerkmalen schwierig. Die Messung kleinerer Intervalle zwischen einem Ereignis von Interesse und einem Meilenstein des Zellzyklus (z. B. Knospenaufgang, Eintritt in die S-Phase oder Beginn der Anaphase) kann dazu beitragen, Fehler zu reduzieren, wenn diese Orientierungsereignisse verfolgt werden 1,2,3,9,10,11,12. Subtile, aber wichtige Unterschiede können jedoch bei diesen Ad-hoc-Methoden unentdeckt oder verschleiert bleiben. Schließlich ermöglichen Einzelzellanalysen die Analyse des Zellzyklusverlaufs, ohne auf Synchronisation oder Ausrichtung angewiesen zu sein¹³, obwohl groß angelegte Messungen in Einzelzellstudien schwierig und kostspielig sein können.

Um diese Schwierigkeiten zu überwinden, haben wir das Modell Characterizing Loss of Cell Cycle Synchrony (CLOCCS) entwickelt, um die Analyse von Zeitreihenmessungen an synchronisierten Populationen zu unterstützen^14,15. CLOCCS ist ein flexibles mathematisches Modell, das die Verteilung synchronisierter Zellen über die Phasen des Zellzyklus hinweg beschreibt, wenn sie aus der Synchronität befreit werden und den Zellzyklus durchlaufen. Der Rahmen für den Verzweigungsprozess ermöglicht es dem Modell, die asymmetrischen Eigenschaften von Mutter- und Tochterzellen nach der Teilung zu berücksichtigen, wie sie bei S. cerevisiae beobachtet wurden, während es für Organismen, die sich durch Spaltung teilen, wie z. B. S. pombe, immer noch nützlich ist. Das Modell kann Eingaben aus einer Vielzahl von Messtypen verwenden, um die Zellzyklusphase zu spezifizieren. Es kann Phasendaten des knospenden Zellzyklus aufnehmen, die Messungen des Prozentsatzes der knospenden Zellen im Laufe der Zeit enthalten, was die Schätzung der Anzahl der Zellen außerhalb der nicht knospenden G1-Phase ermöglicht^14,15. Das Modell kann auch durchflusszytometrische Daten aufnehmen, die den DNA-Gehalt messen, und ermöglicht so die Beurteilung von Landmark-Übergängen von G1 zu S, S zu G2 und M zu G1¹⁵. Fluoreszierende morphologische Marker können auch verwendet werden, um die Phase des Zellzyklus zu identifizieren. Die Fluoreszenzmarkierung von Myosinringen, Zellkernen und Spindelpolkörpern (SPBs) kann zur Bestimmung der Zellzyklusphase verwendet werden, und diese wurden in das CLOCCS-Modell¹¹ integriert. Diese Messungen werden in diesem Protokoll jedoch nicht beschrieben. Zusätzlich wurde der Septationsindex als Input für die Modellierung von Daten von S. pombe¹⁴ verwendet. Somit kann das Modell für Zellzyklusanalysen in einer Vielzahl von Organismen eingesetzt und weiter ausgebaut werden.

CLOCCS ist ein parametrisches Modell, das die vollständige Bayes'sche Inferenz mehrerer Parameter aus den Eingabedaten (z. B. Knospungsprozentsatz, DNA-Gehalt) ermöglicht. Zu diesen Parametern gehören die Erholungszeit von der Synchronität, die Länge der Zellzyklusperiode (getrennt geschätzt für Mutter- und Tochterzellen) und die durchschnittliche Zellzyklusposition der Zellen zu jedem Zeitpunkt. Diese Parameter repräsentieren das Verhalten der durchschnittlichen Zelle in der Population und ermöglichen es dem Forscher, jeden Zeitpunkt einer Zellzyklusposition zuzuordnen, die als Lebenslinienpunkt ausgedrückt wird. Die Umrechnung in Seilsicherungspunkte hängt von den CLOCCS-Parametern lambda (λ) und mu0 (μ₀)^14,15 ab. Der Parameter λ entspricht der durchschnittlichen Zellzykluszeit der Mutterzellen. Aufgrund der Mutter-Tochter-Verzögerung^14,15 ist dies jedoch nicht die durchschnittliche Zellzyklusperiode der gesamten Population, die sowohl die Mutter- als auch die Tochterzellen umfasst. CLOCCS leitet zusätzlich den Parameter delta (δ ab, der der Mutter-Tochter-Verzögerung entspricht und somit die Berechnung der durchschnittlichen Zellzyklusperiode der gesamten Population ermöglicht. Da jedes Experiment nach der Freigabe der Zellzyklussynchronisierung beginnt, wird die Zeit, die für die Wiederherstellung nach der Synchronisationsmethode erforderlich ist, durch den CLOCCS-Parameter μ₀ dargestellt. CLOCCS passt ein Modell an die eingegebenen Zellzyklus-Phasendaten an und leitet diese Parameter dann mit einem Random-Walk-Markov-Ketten-Monte-Carlo-Algorithmus^{ab 14,15}. Durch die Zuordnung mehrerer Experimente zu einer gemeinsamen Zeitskala der Zellzykluslebenslinie können direkte phasenspezifische Vergleiche zwischen Replikaten oder Experimenten durchgeführt werden, bei denen die Erholungszeit oder die Zellzykluszeiten nicht identisch sind 8,14,15.

Da synchronisierte Populationen im Laufe der Zeitreihen^14,15,16,17 mit einer gewissen Rate an Synchronität verlieren^, kann die Variabilität der Rate des Synchronitätsverlusts auch quantitative Vergleiche zwischen Experimenten erschweren. Durch die Identifizierung der Position von Populationen und der Varianz in ihren Verteilungen berücksichtigt CLOCCS Unterschiede in den Raten des Synchronitätsverlusts. Dieses leistungsstarke Werkzeug ermöglicht spezifische und detaillierte Vergleiche zwischen Experimenten und bietet so die Möglichkeit, relevante Vergleiche nicht nur zwischen Replikaten, sondern auch zwischen Umweltbedingungen, Mutanten und sogar Spezies mit dramatisch unterschiedlichem Zellzyklus-Timing direkt durchzuführen^14,15.

In diesem Artikel wird eine Methode beschrieben, die CLOCCS verwendet, um Parameter zu schätzen, indem Daten aus Synchronie-/Release-Zeitreihenexperimenten angepasst, die Daten einer gemeinsamen Lebenslinienskala zugeordnet und dann relevante Vergleiche zwischen Wiederholungen oder Experimenten durchgeführt werden. Die Ausrichtung der Lebenslinie ermöglicht direkte phasenspezifische Vergleiche zwischen diesen Experimenten, was die Aggregation und den Vergleich von Replikaten sowie relevantere Vergleiche zwischen Experimenten mit unterschiedlichen Erholungszeiten und Zellzyklusperioden ermöglicht.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Sammeln von Zellzyklusphasen- und experimentellen Daten

Synchronisieren Sie die Zellen in Bezug auf den Zellzyklus unter Verwendung der gewünschten Synchronisationsmethode (z. B. zentrifugale Abschlämmung, wie in Leman et al.18 beschrieben, oder Paarungspheromonarrest, wie in Rosebrock 19 beschrieben; sowohl Leman et al.18 als auch Rosebrock ¹⁹ beinhalten auch Methoden zur Freisetzung aus der Synchronität). Beginnen Sie mit der Stichprobenentnahme während der gesamten Zeitreihe, stellen Sie sicher, dass die Zeitreihe mindestens zwei volle Zellzyklusperioden lang ist, und sammeln Sie optimalerweise mindestens 10 Stichproben pro Zellzyklus. Sammeln Sie zu jedem Zeitpunkt eine Probe für Zellzyklusphasendaten (Knospung oder Durchflusszytometrie) und eine Probe für experimentelle Daten, wie unten beschrieben.
Wenn Sie Knospungsdaten als Zellzyklusphasendaten verwenden, sammeln Sie Daten zum Knospung für das CLOCCS-Alignment.
1. Stichprobe während der gesamten Zeitreihe. Sammeln Sie für jeden Zeitpunkt Zellen und fixieren Sie sie, indem Sie 200 μl beschallte Zellkultur mit 200 μl Fixierlösung mischen, wie in Leman et ^al.18 beschrieben.
2. Für die Standard-Knospung zählen Sie mindestens 200 Zellen pro Zeitpunkt mit einem Durchlichtmikroskop mit einem 40x-Objektiv und einem Hämozytometer. Geben Sie die Zellprobe aus Schritt 1.2.1 in das Hämozytometer und verdünnen Sie sie, wenn die Dichte das Zählen nicht zulässt. Notieren Sie die Anzahl der knospenden und nicht knospenden Zellen zu jedem Zeitpunkt. Berechnen Sie den Prozentsatz der knospenden Zellen und zeichnen Sie für jeden Zeitpunkt in einer knospenden Kurve.
  HINWEIS: Es stehen andere Methoden zur Angabe der Zellzyklus-Phaseninformationen zur Verfügung, die jedoch in diesem Protokoll nicht beschrieben werden. Die anderen Methoden sind in der CLOCCS-Readme und in einer früheren Arbeit¹¹ beschrieben.
Wenn Sie durchflusszytometrische DNA-Gehaltsdaten als Zellzyklusphasendaten verwenden, erfassen Sie durchflusszytometrische DNA-Färbedaten für die durchflusszytometrische CLOCCS-Ausrichtung.
1. Stichprobe während der gesamten Zeitreihe. Sammeln Sie für jeden Zeitpunkt Zellen und fixieren Sie sie, wie in Haase und Reed²⁰ beschrieben.
2. Färben Sie die DNA und analysieren Sie sie mit der durchflusszytometrischen Standardanalyse. Ein empfohlenes Färbeprotokoll für S. cerevisiae ist in Haase und Reed²⁰ beschrieben.
Sammeln Sie zugehörige Omics oder zugehörige experimentelle Daten. Für Standard-Transkriptomdaten sammeln Sie wie in Leman et ^al.18 und Kelliher et ^al.21,22 beschrieben. Stellen Sie sicher, dass die Daten mit Zeitpunkten verknüpft sind, die Phasendaten des Zellzyklus enthalten, um eine nachgelagerte Ausrichtung zu ermöglichen. Stellen Sie für eine optimale Ausrichtung sicher, dass jedem Zeitpunkt, der experimentelle Daten enthält, auch Phasendaten zugeordnet sind.
HINWEIS: Die experimentellen Daten können viele Formen annehmen. Traditionell verwenden wir die beschriebene Alignment-Methode für die Ausrichtung von Zeitreihen-Transkriptom-Experimenten. Jede Art von Daten, die mit Zeitpunkten verknüpft sind, kann jedoch abgeglichen werden (z. B. Proteomik²²).

2. Installation der erforderlichen Software

HINWEIS: In diesem Abschnitt wird davon ausgegangen, dass Conda, Java 19 und Git bereits installiert sind (Materialtabelle).

Laden Sie das CLOCCS_alignment Repository herunter, indem Sie den folgenden Befehl in das Terminal eingeben:
git clone git clone https://gitlab.com/haase-lab-group/cloccs_alignment.git
Erstellen Sie eine Conda-Umgebung mithilfe der Datei conda_req.yml, indem Sie den folgenden Befehl in das Terminal in dem Ordner eingeben, in dem das CLOCCS_alignment Repository geklont wurde:
conda env create -f conda_req.yml

3. Verwendung von CLOCCS zur Parametrisierung der Experimente

Doppelklicken Sie auf die cloccs_v2023.jar Datei im Ordner CLOCCS im CLOCCS_alignment Repository, und warten Sie, bis eine grafische Benutzeroberfläche geöffnet wird. Dieser Bildschirm ermöglicht die Eingabe von Optionen für den CLOCCS-Lauf und zeigt die Ergebnisse nach der Ausführung an.
Geben Sie die allgemeinen Einstellungen ein.
1. Legen Sie Sim Anneal, Burn In und Iterationen fest, indem Sie in die zugehörigen Texteingabefelder tippen. Sim Anneal (simuliertes Glühen) identifiziert gute Startparameterwerte, Burn In sucht nach A-posteriori-Moden und die letzte Stufe ermöglicht es, alle A-posteriori-Inferenzen zu ziehen. Höhere Werte erhöhen die Laufzeit, erhöhen aber auch die Genauigkeit.
2. Geben Sie die Versuchsbedingungen ein, indem Sie die Temperatur in Celsius und die Synchronisationsmethode über das Textfeld Temperatur und das Dropdown-Menü Synchro angeben. Methode.
3. Optional können Sie die erweiterten Einstellungen im Menü "Erweiterte Einstellungen" konfigurieren. Die erweiterten Einstellungen ermöglichen das Setzen von Prioritäten für jeden der Parameter ("mu0", "sigma0", "sigmav", "lambda", "bud.start", "bud.end").
  HINWEIS: Weitere Informationen zu den erweiterten Einstellungen finden Sie in der Readme.txt im Ordner CLOCCS des CLOCCS_alignment-Repositorys.
Geben Sie die Einstellungen für die Verwendung mit den knospenden Daten ein.
1. Wählen Sie die entsprechende Auswahl aus dem Dropdown-Menü Modelltyp aus. Die Standardoption Bud ist für Standard-Knospeninformationen für knospende Hefe.
  HINWEIS: Im Dropdown-Menü gibt es auch andere, erweiterte Optionen: Mutant für Knospungsinformationen für Mutanten, die mehrere Knospungszyklen ohne Teilung durchlaufen, BudSSLSMR für Knospungsinformationen und zusätzliche Informationen über den Spindelpolkörper und den Myosinring und BudNucDivNeck für Knospungsinformationen und zusätzliche Informationen zur Teilung und zum Knospenhalskern. Diese erweiterten Optionen sind in der CLOCCS-Readme-Datei und in früheren Arbeiten^11,14,15 beschrieben.
2. Importieren Sie die Daten mithilfe des Bedienfelds "Datenimport", indem Sie sie in die Texteingabefelder eingeben oder eine Datei hochladen, indem Sie auf die Schaltfläche " Datei auswählen" klicken. Die erste Spalte gibt die Zeitpunkte an. Die verbleibenden zwei Spalten geben die Daten an, die sich entwickeln, und können eine der folgenden Optionen annehmen: die Anzahl der nicht knospenden Zellen (keine Knospe), die Anzahl der knospenden Zellen (Knospe) oder die Gesamtzahl der Zellen (Total).
Geben Sie die Einstellungen für die Verwendung mit den durchflusszytometrischen Daten ein. Führen Sie für jedes Experiment entweder Schritt 3.3 oder Schritt 3.4 aus.
HINWEIS: Durchflusszytometrische Daten und knospende Daten können zusammen verwendet werden. Obwohl wir zuvor beschrieben haben, dass sie zusammen^{ausgeführt werden 15}, müssen sie für dieses Tool unabhängig voneinander ausgeführt und dann verglichen werden.
1. Konvertieren Sie die FCS-Dateien in das richtige CLOCCS-Eingabeformat für die Durchflusszytometrie, indem Sie die Anweisungen in Ergänzende Datei 1 befolgen (auch im CLOCCS_alignment-Repository als CLOCCS/flow_cytometry_conversion_instructions.txt zu finden).
2. Wählen Sie die Flow-Auswahl aus dem Dropdown-Menü Modelltyp aus.
3. Importieren Sie die Daten mithilfe des Bedienfelds "Datenimport". Klicken Sie auf Datei auswählen und wählen Sie die in Schritt 3.4.1 generierte Datei aus.
4. Wählen Sie die Zeitpunkte aus, für die eine durchflusszytometrische CLOCCS-Anpassung dargestellt werden soll, indem Sie die Zeitpunkte im Feld Zeiten für die Anpassung auswählen.
Sobald alle Eingänge entweder für die Knospung oder die Durchflusszytometrie ausgewählt wurden, klicken Sie auf die Schaltfläche Anwenden und dann auf die Schaltfläche Probe oben auf dem Bildschirm.
Zeigen Sie die Knospenkurve oder die Durchflusszytometriediagramme mit den vorhergesagten Anpassungen an, indem Sie die Registerkarte Vorhergesagte Anpassungen auswählen. Diese Registerkarte wird standardmäßig unmittelbar nach dem vorherigen Schritt geöffnet.
Zeigen Sie die Parameterhistogramme für jeden Parameter an, indem Sie die Registerkarte Parameterhistogramme auswählen und dann aus den folgenden Optionen die Unterregisterkarte auswählen, die dem gewünschten Parameter entspricht: mu0, delta, sigma0, sigmav, lambda, bud.start, bud.end usw.
Zeigen Sie das Diagramm der A-posteriori-Partitur an, indem Sie die Registerkarte A-posteriori-Score auswählen.
Zeigen Sie die Einstellungen an und ändern Sie sie weiter, indem Sie die Registerkarte Einstellungen auswählen. Zeigen Sie das Protokoll der vorherigen Ausführungen an, indem Sie die Registerkarte Protokoll auswählen.
Rufen Sie die CLOCCS-Parameter aus der Anpassung ab, indem Sie die Registerkarte A-posteriori-Parameter auswählen. Die resultierende Tabelle hat die folgende Form: Jede Zeile besteht aus einem Parameter, wobei die letzte Zeile die hintere ist. Die Spalten bestehen aus dem vorhergesagten Parameter für den Mittelwert, dem unteren Konfidenzintervall von 2,5 %, dem oberen Konfidenzintervall von 97,5 % und der Akzeptanzrate.
1. Notieren Sie die Parameter, die für die Ausrichtung für jedes Experiment verwendet werden: die Erholungszeit von der Synchronität (μ₀) und die durchschnittliche Zellzykluszeit der Mutterzellen (λ).
2. Berechnen Sie die Zellzyklusperiode, indem Sie den Durchschnitt der Mutterzellperiode (λ) und der Tochterzellperiode (λ + δ) berechnen, wobei δ die tochterspezifische Verzögerung ist.
  Anmerkungen: Wiederholen Sie Abschnitt 3 mit allen Experimenten, die in die Vergleiche einbezogen werden sollen.

4. Konvertierung von Zeitpunkten in Lebenslinienpunkte mit den Python-Konvertierungsfunktionen und den CLOCCS-Parametern

HINWEIS: Für die Umrechnung zwischen Zeitpunkten und Lebenslinienpunkten sind zwei Umrechnungsformeln²¹ erforderlich. Eine Python-Implementierung für die Konvertierung und Datenvisualisierung ist im CLOCCS_alignment Repository verfügbar und wird im Folgenden beschrieben.

Aktivieren Sie die Conda-Umgebung, indem Sie den folgenden Befehl in das Terminal eingeben: conda activate CLOCCS_alignment
Öffnen Sie ein interaktives Python-Notebook, indem Sie den folgenden Befehl in das Terminal eingeben: jupyter notebook
Erstellen Sie ein neues Python-Notebook im gewünschten Ordner.
Hinweis: Ein Beispiel-Notebook wurde zur Veranschaulichung der Standardverwendung beigefügt und befindet sich in Alignment/JOVE_example.ipynb im CLOCCS_-Ausrichtungsrepository.
Importieren Sie die Python-Datei mit den Ausrichtungsfunktionen, indem Sie den folgenden Befehl in der ersten Zelle ausführen:
%run path_to_repo/cloccs_alignment/Alignment/utilities.py
1. Ersetzen Sie path_to_repo durch den Pfad zum CLOCCS_alignment Repository.
Wenn Sie Knospendaten als Phasendaten des Zellzyklus verwenden, importieren Sie einen Datenrahmen, der den Prozentsatz enthält, der zu jedem Zeitpunkt geknospet wurde, indem Sie den folgenden Befehl in einer neuen Zelle ausführen:
budding_df = pd.read_csv("path_to_folder/budding_filename.tsv", sep ="\t", index_col=0)
1. Ersetzen Sie den entsprechenden Dateipfad und Dateinamen. Wenn es sich bei der Datei um eine .csv Datei handelt, entfernen Sie sep ="\t"
Wenn Sie Knospendaten als Zellzyklusphasendaten verwenden, richten Sie die Knospendaten an einer Zeitskala für Lebenslinienpunkte aus, indem Sie die folgende Funktion in eine neue Zelle eingeben:
aligned_budding_df = df_conversion_from_parameters(budding_df, Zeitpunkte, param_mu0, param_lambda)
1. Ersetzen Sie Zeitpunkte durch eine Liste der Zeitpunkte, die als Index des budding_df Datenrahmens dienen sollen.
2. Für param_mu0 und param_lambda ersetzen Sie das Experiment durch die gelernten Parameter aus dem angehenden CLOCCS-Lauf.
Wenn Sie Durchflusszytometriedaten verwenden, importieren Sie die Durchflusszytometriedaten, indem Sie den folgenden Befehl in einer neuen Zelle ausführen:
flow_samples = flow_cytometry_import(flow_input_folder)
1. Ersetzen Sie flow_input_folder durch den entsprechenden Pfad zu dem Ordner, der die .fcs-Dateien für die Durchflusszytometrie enthält.
Wenn Sie Durchflusszytometriedaten verwenden, generieren Sie für jedes Experiment eine Umrechnungstabelle zwischen den Zeitpunkten und Lebenslinienpunkten, indem Sie den folgenden Befehl in eine neue Zelle eingeben:
flow_converter = convert_tp_to_ll(Zeitpunkte, param_mu0, param_lambda)
1. Ersetzen Sie Zeitpunkte durch eine Liste der Zeitpunkte aus den Durchflusszytometriedaten.
2. Für param_mu0 und param_lambda ersetzen Sie das Experiment durch die erlernten Parameter aus der Durchflusszytometrie, die CLOCCS in Abschnitt 3 durchgeführt hat.
Importieren Sie den Datenrahmen, der die experimentellen Daten enthält, in das Notebook, indem Sie den folgenden Befehl in einer neuen Zelle ausführen:
data_df = pd.read_csv("path_to_folder/exp_data_filename.tsv", sep ="\t", index_col=0)
1. Ersetzen Sie den entsprechenden Dateipfad und Dateinamen. Wenn es sich bei der Datei um eine .csv Datei handelt, entfernen Sie sep ="\t".
  HINWEIS: Dies kann für alle tabellarischen Daten erfolgen. Die experimentellen Daten müssen lediglich die Zeitpunkte entweder als Spalten oder als Index des Datenrahmens aufweisen. Beispieldaten finden Sie im CLOCCS_alignment Repository.
Richten Sie die experimentellen Daten an einer Zeitskala eines Lebenslinienpunkts aus, indem Sie die folgende Funktion in eine neue Zelle eingeben:
lifeline_aligned_df = df_conversion_from_parameters(data_df, Zeitpunkte, param_mu0, param_lambda, interpolieren, lowerll, upperll)
1. Ersetzen Sie Zeitpunkte durch eine Liste der Zeitpunkte als Index oder Spalten der experimentellen data_df aus dem vorherigen Schritt.
2. Für param_mu0 und param_lambda sind die Werte in Abschnitt 3 von CLOCCS zu verwenden.
  HINWEIS: Die Parameter können aus jedem CLOCCS-Lauf stammen, der für einen der akzeptierten Zellzyklusphasen-Datentypen ausgeführt wird.
3. Optional können Sie interpolieren durch "True" oder "False" ersetzen oder das Feld leer lassen (der Standardwert ist "False").
  HINWEIS: Wenn diese Einstellung auf " False" festgelegt ist, werden die Daten nicht interpoliert. Wenn der Wert auf True festgelegt ist, werden die Lebenslinienpunkte gerundet und interpoliert, um die Werte zwischen den Lebenslinienpunkten auszufüllen, sodass ein Punkt pro Ganzzahl im Bereich der Lebenslinienpunkte vorhanden ist. Dies ermöglicht einen besseren Vergleich zwischen Datensätzen.
4. Ersetzen Sie optional lowerll und upperll durch None oder ganzzahlige Werte.
  HINWEIS: Wenn diese Option auf "Keine" festgelegt ist, werden alle Lebenslinienpunkte nach der Interpolation beibehalten. Wenn ganze Zahlen angegeben werden, werden die Daten abgeschnitten, sodass die Lebenslinienpunkte vom unteren zum oberen Bereich reichen. Dies ermöglicht den Vergleich zwischen Datensätzen mit einem anderen Unter- oder Oberteil.
Laden Sie das an der Lebenslinie ausgerichtete Dataset herunter, indem Sie den folgenden Befehl in eine neue Zelle eingeben: lifeline_aligned_df.to_csv("path_to_desired_location/name_of_file.tsv", sep = "\t")
Wiederholen Sie die Schritte 4.5-4.11 mit allen Experimenten, die in die Vergleiche einbezogen werden sollen.

5. Vergleich von Knospkurven und Durchflusszytometriedaten

Zeichnen Sie die knospenden Kurven vor der Ausrichtung mit der Python-Dienstprogrammfunktion, indem Sie den folgenden Befehl in eine neue Zelle eingeben:
plot_budding_curves(list_of_budding_curves, list_for_legend = leg_list, point_type = str_type, Titel = str_title)
1. Ersetzen Sie eine Liste mit den Datenrahmen aller gewünschten knospenden Kurven zum Zeichnen von list_of_budding_curves-[bud_df1, bud_df2, bud_df3].
2. Ersetzen Sie bei Bedarf eine Liste der Beschriftungen für die Legende [Experiment 1, Experiment 2, Mutant] durch leg_list. Ist dies nicht der Fall, schließen Sie None aus oder ersetzen Sie Keine.
3. Ersatzzeit für str_type.
4. Ersetzen Sie str_title bei Bedarf durch einen Zeichenfolgentitel Comparison Budding Curves . Wenn nicht, ersetzen Sie "Keine" oder schließen Sie es aus.
Zeichnen Sie die knospenden Kurven nach der Ausrichtung mit der Python-Dienstprogrammfunktion, indem Sie die Anweisungen in Schritt 5.1 befolgen, jedoch mit einer Liste der ausgerichteten knospenden Kurven, die durch list_of_budding_curves ersetzt werden, und mit einer Lebenslinie für point_type anstelle von Zeit.
Um die Durchflusszytometriedaten darzustellen, zeichnen Sie die zugehörigen Daten aus den .fcs-Dateien an den entsprechenden Lebenslinienpunkten mit dem in Schritt 4.8 generierten Konverter auf.
Konvertieren Sie die Seilsicherungspunkte mithilfe der Konvertertabelle in die Zellenzyklusphase (Tabelle 1).
HINWEIS: Dies kann auch geplottet werden, indem Sie den Anweisungen in Schritt 5.1 folgen, jedoch mit Phase für point_type anstelle von Zeit.

6. Vergleich der experimentellen Daten

Bestimmen Sie die Genliste, die in den Liniendiagrammen dargestellt werden soll, basierend auf Literaturinformationen oder den Genen, die für die Forschung von Interesse sind.
Verwenden Sie die in der Python-Dienstprogrammdatei bereitgestellten plot_linegraph_comparison, um Liniendiagrammvergleiche für den ursprünglichen, ausgerichteten oder ausgerichteten und interpolierten Datenrahmen durchzuführen, indem Sie den folgenden Befehl in eine neue Zelle eingeben:
plot_linegraph_comparison(list_of_dfs, list_for_legend, Genelist, point_type = str_type, Titel = str_title)
1. Ersetzen Sie list_of_dfs durch eine Liste der Datenrahmen der zu vergleichenden Experimente.
  HINWEIS: Die Datenrahmen können nicht ausgerichtet oder ausgerichtet sein. Die entsprechenden point_type müssen jedoch in Schritt 6.2.4 eingegeben werden.
2. Ersetzen Sie eine Liste der Titel für jeden Datenrahmen in der gleichen Reihenfolge wie die Liste der Datenrahmen für list_for_legend.
3. Ersetzen Sie eine Liste der Gennamen (die im Index der Datenrahmen enthalten sein müssen), die für die Geneliste dargestellt werden sollen.
4. Ersetzen Sie str_type durch den Punkttyp. Verwenden Sie die Lebenslinie (die Standardeinstellung ist die Lebenslinienpunktskala) oder die Phase (die Lebenslinienskala der Zellzyklusphase) für die ausgerichteten Datenrahmen in Schritt 6.2.1 oder die Zeit für die nicht ausgerichteten Datenrahmen in Schritt 6.2.1.
5. Ersetzen Sie str_title durch einen optionalen Zeichenfolgentitel.
Bestimmen Sie die Genliste, die in die Heatmap aufgenommen werden soll, indem Sie die Literatur oder Algorithmen verwenden, um die wichtigsten periodischen Gene zu bestimmen.
HINWEIS: Für ordnungsgemäße Heatmap-Vergleiche sollten die Daten in Schritt 6.2 ausgerichtet, interpoliert und zeitskalisch angepasst werden. Es sollte für jedes Experiment den gleichen Start- und Endwert für die Lebenslinie haben.
1. Führen Sie Periodizitätsalgorithmen aus, um die wichtigsten periodischen Gene^23,24 zu bestimmen^, oder verwenden Sie die gewünschten alternativen Methoden, um die Genliste (d. h. Literaturergebnisse) zu bestimmen.
2. Importieren Sie eine .csv- oder TSV-Genlistendatei in das Notizbuch, indem Sie den folgenden Befehl in eine neue Zelle verwenden:
  sort_df = pd.read_csv("path_to_folder/sorting_filename.tsv", sep="\t", index_col=0)
3. Ersetzen Sie den entsprechenden Dateipfad und Dateinamen. Wenn es sich bei der Datei um eine .csv Datei handelt, entfernen Sie sep="\t".
Verwenden Sie die bereitgestellte Funktion plot_heatmap_comparison in der Python-Dienstprogrammdatei, um einen Heatmap-Vergleich für den ausgerichteten, interpolierten und phasenausgerichteten Datenrahmen durchzuführen, indem Sie den folgenden Befehl in eine neue Zelle eingeben:
plot_heatmap_comparison(list_of_dfs, list_for_legend, Genelist, Titel = str_title)
1. Ersetzen Sie list_of_dfs durch eine Liste der ausgerichteten Datenrahmen der zu vergleichenden Experimente.
2. Ersetzen Sie eine Liste der Titel für jeden Datenrahmen in der gleichen Reihenfolge wie die Liste der Datenrahmen für list_for_legend.
3. Ersetzen Sie eine Liste der Gennamen (die im Index der Datenrahmen enthalten sein müssen), die für die Geneliste dargestellt werden sollen.
4. Ersetzen Sie str_title durch einen optionalen Zeichenfolgentitel.
  HINWEIS: Der erste Datenrahmen in der Liste ist derjenige, der für die Sortierung der Gene in der Heatmap verwendet wird. Die Gene werden in der ersten Periode für diesen Datenrahmen nach dem Maximum sortiert, und die gleiche Reihenfolge wird für die nachfolgenden Datenrahmen in der Liste verwendet.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Die im obigen Protokoll und im Workflow in Abbildung 1 beschriebenen Schritte wurden auf fünf Zellzyklus-synchronisierte Zeitreihenexperimente angewendet, um zwei repräsentative Vergleiche zu demonstrieren: zwischen Replikaten mit unterschiedlichen Synchronitätsmethoden (Paarungspheromon und zentrifugale Elutriierung¹⁸) und Sequenzierungsplattformen (RNA-Sequenzierung [RNA-seq] und Microarray) sowie zwischen experimentellen Bedingungen. Es wurden mehrere Experimente mit S. cerevisiae durchgeführt, und für jedes Experiment wurden Daten zur Zellzyklusphase und zum Experiment gesammelt. Der Arbeitsablauf umfasst die Verwendung von CLOCCS zur Parametrisierung der verschiedenen Synchronie-/Release-Zeitreihenexperimente, die Verwendung dieser Parameter, um die Experimente an einer gemeinsamen vergleichbaren Lebenslinienskala auszurichten, und die anschließende Verwendung dieser ausgerichteten Experimente für die beiden repräsentativen Vergleiche.

Um den repräsentativen Vergleich zwischen den Replikaten zu demonstrieren, wählten wir drei Experimente aus, die mit demselben Stamm und unter denselben experimentellen Bedingungen durchgeführt wurden, die als Bedingung 1 bezeichnet werden. Zwei dieser Experimente waren direkte Wiederholungen voneinander, und beide wurden mittels Microarray-Analyse analysiert und durch zentrifugale Abschlämmung synchronisiert. Das dritte Experiment wurde mittels RNA-seq-Analyse analysiert und mittels Alpha-Faktor-Paarungspheromonarrest synchronisiert. Um den zweiten Vergleich zwischen Experimenten mit unterschiedlichen Zellzyklusperioden zu demonstrieren, wurde das RNA-seq-Experiment mit Bedingung 1 (Zellzyklusperiode: 71 min) von oben mit Bedingung 2 (Zellzyklusperiode: 82 min) und Bedingung 3 (Zellzyklusperiode: 110 min) verglichen (Tabelle 2). Für jedes Experiment wurden die Zellen unter ihren jeweiligen Bedingungen gezüchtet, synchronisiert, freigesetzt und dann über zwei oder mehr Zellzyklusperioden hinweg beprobt. Die Knospungs- und/oder Durchflusszytometriedaten wurden gesammelt, um Informationen über die Zellzyklusphase zu liefern, und es wurden entweder Microarray- oder RNA-seq-Zeitreihen-Transkriptomdaten gesammelt, wie in Leman et ^al.18 beschrieben (Supplemental Table S1).

Für jedes Experiment nahmen die Daten die in Abbildung 2 beschriebenen Formen an, in der das Bedingung-2-Experiment als Beispiel zur Demonstration dargestellt wird. Jeder Datensatz hatte eine Knospenkurve, die Rückschlüsse auf die Zellzyklusphase ermöglichte. Diese Kurve enthielt einen knospenden Prozentwert für jeden Zeitpunkt in der Zeitreihe, der dann aufgetragen wurde, um eine knospende Kurve zu erzeugen, die mehrere Zellzyklusoszillationen anzeigt (Abbildung 2). Die Daten der Zellzyklusphase wurden auch in Form von durchflusszytometrischen DNA-Gehaltsfärbedaten für jeden Zeitpunkt in der Zeitreihe verwendet. Ausgewählte Zeitpunkte für Bedingung 2 wurden grafisch dargestellt (Abbildung 2). Die Durchflusszytometrie-Dateien wurden in einer einzigen Tabelle zusammengefasst, die die Zellen in jedem logarithmischen Fluoreszenzbehälter für jeden Zeitpunkt für die Eingabe in die CLOCCS mit der Funktion flow_cytometry_CLOCCS_file_from_fcs in den Python-Dienstprogrammen enthält. Jeder Datensatz enthielt auch experimentelle Daten. In diesem Fall handelte es sich um transkriptomische Daten, und die Daten waren in Reihen von Genen organisiert, von denen jede einen Wert für die Häufigkeit von RNA zu jedem Zeitpunkt des Experiments hatte (Abbildung 2).

Wir haben die Verwendung von CLOCCS und die Konvertierung in Lebenslinienpunkte für den Condition 2 RNA-seq-Datensatz demonstriert; Der Prozess war jedoch auch bei den anderen Experimenten identisch. Die knospenden Informationen wurden in den CLOCCS-Algorithmus eingegeben, wie in Protokollabschnitt 3 beschrieben und in Abbildung 3A gezeigt. Es wurden die Standardwerte für Sim Anneal, Burn In, Iterationen und Erweiterte Einstellungen verwendet. Die geeigneten Versuchsbedingungen wurden ausgewählt. Für die Knospendaten wurde der Modelltyp "Bud" verwendet. Die resultierenden CLOCCS-Knospungsanpassungen wurden untersucht, um sicherzustellen, dass die Knospungskurven richtig angepasst waren, wie die Datenpunkte zeigen, die die entsprechende Anpassungskurve mit einem kleinen 95%-Konfidenzband überlagern (Abbildung 3B und ergänzende Abbildung S1). Die Parameter μ₀ und λ aus der hinteren Parametertabelle (Abbildung 3C) wurden für die Verwendung im Alignment aufgezeichnet. Die Durchflusszytometriedaten für Bedingung 2 wurden, wie in Protokollabschnitt 3 beschrieben, separat in CLOCCS eingegeben. Derzeit erwartet CLOCCS, dass Durchflusszytometer 10-Bit-Daten mit 1.024 Kanälen erzeugen. Moderne Durchflusszytometer können jedoch mehr Kanäle haben. Da unser Durchflusszytometer Daten mit mehr als 1.024 Kanälen produziert, wurden die Daten in 1.024 Bins eingeteilt. Mit den Phasendaten des Zellzyklus durch die Durchflusszytometrie erstellt CLOCCS eine CLOCCS-Anpassung für jeden ausgewählten Zeitpunkt (Abbildung 3D und ergänzende Abbildung S2) und liefert eine Tabelle mit A-posteriori-Parametern, die der Tabelle mit den knospenden A-posteriori-Parametern in Abbildung 3C ähnelt. Die Parameter für die Knospung, die CLOCCS für jedes der anderen Experimente durchführt, sind in Tabelle 2 beschrieben, und die Parameter für die Durchflusszytometrie, die CLOCCS durchführt, sind in der ergänzenden Tabelle S2 beschrieben.

Für die Ausrichtung der Lebenslinie wurden die CLOCCS-Parameter verwendet, die der Zellzyklusperiode der Mutterzellen (λ) und der Erholungszeit (μ₀) entsprechen. Es ist wichtig zu beachten, dass λ nicht unbedingt die durchschnittliche Zellzyklusperiode der Zellpopulation darstellt. In Fällen, in denen sich die Zellen vollständig teilen, gibt es die gleiche Anzahl von Mutter- und Tochterzellen, so dass die durchschnittliche Zellzyklusperiode der Durchschnitt zwischen der Zellzyklusperiode der Mutterzellen (λ) und der Zellzyklusperiode der Tochterzellen (λ + δ) ist. Konkret ist Delta (δ) die Länge der tochterspezifischen Verzögerung. Dies ist die Berechnung, die wir für die Zellzyklusperiode für jedes Experiment verwendet haben (Tabelle 2). Für jedes Experiment wurden dann die entsprechenden Parameter λ und μ₀ in der Konvertierungsfunktion df_conversion_from_parameters verwendet, die in der Python-Dienstprogrammdatei bereitgestellt wird, wie für Bedingung 2 gezeigt (Abbildung 4A). Für die knospenden Kurven wurden die Daten nicht interpoliert. Bei experimentellen Daten wurden die an der Lebenslinie ausgerichteten Datensätze jedoch mithilfe der Interpolation neu abgetastet, sodass jeder Lebenslinienpunkt interpolierte Daten enthielt, um die Darstellung zu verbessern. Um sicherzustellen, dass die an der Lebenslinie ausgerichteten Datasets den gleichen Bereich von Lebenslinienpunkten aufwiesen, wurden untere und obere Lebensliniengrenzwerte festgelegt, um die Daten an diesen Punkten abzuschneiden. Diese lowerll- und upperll-Parameter wurden in die df_conversion_from_parameters-Funktion eingegeben, wenn die Interpolation auf "True" festgelegt wurde. Für den Vergleich von Bedingung 1 wurden sie für alle Datensätze auf 44 bzw. 270 und für den Vergleich zwischen Umgebungsbedingungen auf 50 bzw. 300 festgelegt. Ein Beispiel für die Verwendung dieser Funktionen für die Ausrichtung und den Vergleich finden Sie im Python-Beispielnotebook JOVE_example.ipynb, und der Code, der zum Generieren der Abbildungen verwendet wird, ist im JOVE_Figures.ipynb-Notebook im CLOCCS_alignment Repository zu sehen.

Diese Umrechnung von Zeitpunkten in Lebenslinienpunkte hängt von zwei Formeln²¹ (Abbildung 4A) ab, die μ₀ (Erholungszeit) und λ (Mutterperiode) verwenden. Die erste Formel, , Equation 1 ist die Formel für die Erholungsphase (Abbildung 4A). Diese Formel wird nur für Zeitpunkte innerhalb der Wiederherstellungsphase verwendet, die aus den Zeitpunkten bis einschließlich μ 0 besteht, da μ₀ der Wiederherstellungszeit entspricht. Die Zeitpunkte werden dann in einen Skalenbereich der Lebenslinie umgewandelt, der mit 100 Lebenslinienpunkten endet (Tabelle 1), was das Ende der Erholungsphase und den Beginn des ersten Zellzyklus markiert. In der Phase nach der Wiederherstellung wird die zweite Formel (Abbildung 4A) verwendet, Equation 2 die jeden nachfolgenden Zeitpunkt nach der Wiederherstellung in einen Lebenslinienpunkt nach 100 umwandelt. Alle weiteren 100 Lebenslinienpunkte entsprechen einem neuen Zellzyklus, wobei der erste Zyklus den Lebenslinienpunkten 100 bis 200 entspricht, der zweite Zyklus den Lebenslinienpunkten 200 bis 300 usw. (Tabelle 1). Die Konvertierung von Zeitpunkten in Lebenslinienpunkte wird auf jedes Dataset einzeln angewendet, wobei die entsprechenden CLOCCS-Parameter für dieses Dataset verwendet werden. Nachdem jeder Datensatz in die Lebenslinienskala konvertiert wurde, werden die Zellzyklusphasen ausgerichtet, was phasenspezifische Vergleiche zwischen den Datensätzen ermöglicht.

Tabelle 3 zeigt die Konvertierung ausgewählter Zeitpunkte in ihre jeweiligen Lebenslinienpunkte für die repräsentative Konvertierung des Condition 2-Datensatzes unter Verwendung von Parametern aus dem beginnenden CLOCCS-Lauf. Die aus dem RNA-seq von Condition 2 gesammelten Knospungsdaten wurden in einer Knospkurve dargestellt, die den Prozentsatz der im Laufe der Zeit gekeimten Knospen sowohl für die nicht ausgerichtete Zeitskala in Minuten (Abbildung 4B) als auch für die ausgerichtete Zeitskala in Lebenslinienpunkten (Abbildung 4C) unter Verwendung der Python-Funktion plot_budding_curves in einem Python-Notebook zeigt. Die Lebenslinienpunkte konnten leicht in experimentelle und Zellzyklusphaseninformationen umgewandelt werden (Tabelle 1), und die Erholungsphase und die ersten bis dritten Zellzyklen wurden von Hand entsprechend farbkodiert (Abbildung 4B,C). Da jeder Lebenslinienpunkt einer Zellzyklusphase entsprach, konnten einzelne Durchflusszytometrie-Plots über die Python-Funktionen unter Verwendung der durch das Lifeline-Alignment bestimmten Zellzyklusphase beschriftet werden. Diese Phasen stimmten mit den Phasen überein, die mittels durchflusszytometrischer Analyse für Bedingung 2 bestimmt wurden. Die für den Condition 2-Datensatz gesammelten Durchflusszytometriedaten wurden für ausgewählte Zeitpunkte aufgetragen und unter Verwendung der Zellzyklusphase, die aus dem Alignment der Durchflusszytometrie-Lebenslinie bestimmt wurde, markiert. Die Daten stimmten jeweils mit der durch das Alignment bestimmten Phase überein (Abbildung 4D).

Es ist wichtig zu beachten, dass das Expressionsniveau jedes Gens für jede Probe gleich bleibt, aber die Markierung der Zeitpunkte von Zeit in Minuten zu Lebenslinienpunkten geändert wird. Die Konvertierung erfolgt jedoch nicht linear. Die grau unterstrichene Erholungsphase nimmt einen höheren Prozentsatz der experimentellen Zeit ein, nachdem die Umrechnung in Lebenslinienpunkte durchgeführt wurde (Abbildung 4B,C). Der Vorteil der Lifeline-Skala besteht darin, dass sie detaillierte Phaseninformationen und Phasenvergleiche über Experimente hinweg ermöglicht. Die Phaseninformationen sind in den Seilsicherungspunkten enthalten, wie oben beschrieben und in Tabelle 1 dargestellt. Darüber hinaus ist G1 in den ersten 15,5 Lebenslinienpunkten jedes Zellzyklus, S in den nächsten 20 Lebenslinienpunkten und G2/M in den nächsten 64,5 Lebenslinienpunkten enthalten (Tabelle 1). Dadurch wird die Erholungszeit jedoch künstlich auf die gleiche Zeitspanne jedes aufeinanderfolgenden Zellzyklus beschränkt, selbst wenn die Erholungsphase in der ursprünglichen Zeitpunktskala sehr kurz erscheint. Dies verdeckt die Vergleiche nicht, da die Phasen der einzelnen Experimente aufeinander abgestimmt sind. In den meisten Fällen ist es relevanter, die Daten zu Zeitpunkten zu vergleichen, die in derselben experimentellen und biologischen Phase auftreten, als zu Zeitpunkten, die zur gleichen Zeit in Minuten auftreten.

Nachdem alle Experimente mithilfe der bereitgestellten Python-Funktionen in der Python-Dienstprogrammdatei in die ausgerichtete Lebenslinienskala konvertiert wurden, können sie verglichen werden. Hier zeigen wir zwei gängige Vergleiche zwischen Experimenten: einen zwischen Wiederholungen eines ähnlichen Experiments über Plattformen und Synchronisationsmethoden hinweg (Abbildung 5) und einen zwischen verschiedenen Versuchsbedingungen mit einer sich ändernden Periodenlänge (Abbildung 6 und Abbildung 7). Wie oben beschrieben, erfolgt der erste Vergleich zwischen zwei elutriierten Microarray-Replikaten und einem Alpha-Faktor-synchronisierten RNA-seq-Experiment. Vor der Ausrichtung zeigten die beiden Microarray-Replikate eine ähnliche Synchronität und Zellzyklusdynamik, aber das Microarray-2-Replikat der Bedingung 1 schien leicht verzögert zu sein (Abbildung 5A). Der auffälligste Unterschied zeigte sich beim Vergleich der nicht ausgerichteten Datensätze; Der zweite RNA-seq-Zyklus der Bedingung 1 schien mit dem ersten Zyklus der beiden Microarray-Experimente übereinzustimmen. Der Unterschied hing wahrscheinlich nicht mit den verschiedenen transkriptomischen Plattformen zusammen, sondern eher mit den unterschiedlichen Synchronisationsmethoden. Die Zellpopulationen in den Microarray-Experimenten wurden durch zentrifugale Ausschlämmung synchronisiert, während die Population für das RNA-seq-Experiment durch eine Paarungspheromonbehandlung synchronisiert wurde. Tatsächlich verkürzte die Synchronisation mit dem Paarungspheromon die Erholungszeit im Vergleich zur Abschlämmung erheblich (Abbildung 5A und Tabelle 2).

Trotz der offensichtlichen Unterschiede zwischen den Replikaten, wenn sie in Bezug auf die verstrichene Zeit aufgetragen wurden, waren die Kurven nach der Ausrichtung der Lebenslinie fast identisch, und detailliertere und relevantere Vergleiche zwischen den Replikaten wurden ermöglicht (Abbildung 5B). Die Erholungsphase wurde so ausgerichtet, dass jedes Experiment am gleichen Punkt der Lebenslinie begann und die Variationen in der Periode durch die Ausrichtung der Lebenslinie normalisiert wurden. Aufgrund des Alignments traten experimentelle Werte am gleichen Lebenslinienpunkt über Replikationen hinweg in derselben Zellzyklusphase auf, was Berechnungen der experimentellen Varianz über Replikationen hinweg ermöglichte. Die Erholungs- und Zellzyklusphasen sind in Abbildung 5B beschriftet, um zusätzliche Informationen über die Zellzyklusphasen in jedem der Experimente bereitzustellen. Diese Lifeline-Ausrichtung könnte dann auf den experimentellen Datensatz (Abbildung 5C,D) angewendet werden, indem die Python-Funktion df_conversion_from_parameters in der Dienstprogrammdatei bereitgestellt wird, wie oben beschrieben.

In Abbildung 5D wurden die transkriptomischen Daten abgeglichen und die Expressionsdynamik für das CDC20-Gen mit der plot_linegraph_comparison Python-Funktion in einem Python-Notebook dargestellt. Vor dem Alignment sah es so aus, als ob die erste Peak-Expression der Microarray-Experimente mit dem zweiten Peak des RNA-seq-Experiments übereinstimmte (Abbildung 5C); Nach der Ausrichtung sind die ersten Zellzyklus-Peaks jedes Datensatzes jedoch richtig ausgerichtet (Abbildung 5D). Darüber hinaus schien sich die Peakbreite der Experimente zwischen dem RNA-seq-Datensatz und den Microarray-Datensätzen zu unterscheiden, aber nach dem Alignment war die Peakbreite stärker ausgerichtet (Abbildung 5C,D).

Der zweite Vergleich bezieht sich auf Experimente unter verschiedenen Umweltbedingungen mit unterschiedlichen Zellzyklusperioden (Abbildung 6). Wie oben beschrieben, haben wir S. cerevisiae-Datensätze in Bedingung 1 mit Bedingung 2 und Bedingung 3 verglichen, die Zellzyklusperioden von 71, 82 bzw. 110 Minuten entsprechen. Diese Unterschiede in der Zellzyklusperiode führten zu Unsicherheiten beim Vergleich zwischen Experimenten vor der Phasenausrichtung des Zellzyklus, wie in den nicht ausgerichteten Knospkurven gezeigt. Die Periodenunterschiede sind in den nicht ausgerichteten Knospkurven sichtbar (Abbildung 6A). Wenn sie jedoch mit diesem Protokoll auf CLOCCS ausgerichtet wurden, sahen die drei Kurven bemerkenswert ähnlich aus, was Vergleiche der experimentellen Daten ermöglichte (Abbildung 6B).

Unter Verwendung der durchflusszytometrischen CLOCCS-Parameter wurden Zustand 1 und Zustand 2 auf eine gemeinsame Lebenslinienskala ausgerichtet, und DNA-Gehaltshistogramme wurden in Zustand 2 und an äquivalenten Lebenslinienpunkten in Zustand 1 aufgetragen. Durchflusszytometrische Messungen des DNA-Gehalts an den Punkten der Lebenslinie wurden verglichen (Abbildung 6C). Da die DNA-Gehaltsmessungen nicht kontinuierlich und nicht leicht interpoliert waren, konnten wir nur die nächstgelegenen Lebensaderpunkte vergleichen. Die Phasendaten des Zellzyklus für jeden vergleichbaren Lebenslinienpunkt waren zwischen den beiden Bedingungen nicht identisch (Abbildung 6C), was darauf hindeutet, dass die CLOCCS-Anpassungen und die resultierenden Parameter für Bedingung 1 wahrscheinlich leicht falsch ausgerichtet waren. Dies war wahrscheinlich auf die schlechtere Anpassung des CLOCCS an die durchflusszytometrischen Daten für Zustand 1 im Vergleich zu Zustand 2 zurückzuführen (ergänzende Abbildung 2). Die Ausrichtung wich jedoch nur in einer Probe ab und ermöglicht daher noch verbesserte phasenspezifische Vergleiche.

Die Ausrichtung der knospenden Lebenslinie wurde dann auf die experimentellen Daten für die RNA-seq-Experimente in Bedingung 1, Bedingung 2 und Bedingung 3 (Abbildung 7) angewendet, indem die knospenden CLOCCS-Parameter in der df_conversion_from_parameters-Funktion für die experimentellen Daten verwendet wurden. Die transkriptomischen Daten wurden abgeglichen und die Genexpression des Gens CDC20 für jede Zeitreihe für die drei Experimente gezeigt. Vor dem Alignment war die Transkriptdynamik von CDC20 nicht überlappend (Abbildung 7A). Nach dem Alignment waren der erste und zweite Peak der CDC20-Genexpression für alle drei Datensätze viel enger aufeinander abgestimmt. Nach dem Alignment wurde deutlich, dass die Peaks in der gleichen Zellzyklusphase auftraten, die Formen der Kurven jedoch unterschiedlich waren (Abbildung 7B). Bedingung 3 hatte im Vergleich zu den beiden anderen Bedingungen einen niedrigeren und breiteren ersten Peak, selbst nach Berücksichtigung der Unterschiede in der Zellzyklusperiode, was darauf hindeutet, dass diese Unterschiede wahrscheinlich mit den getesteten experimentellen Bedingungen zusammenhingen (Abbildung 7B).

Es konnten auch groß angelegte transkriptomische Vergleiche angestellt werden. Für diese Vergleiche wurden 278 Gene ausgewählt, indem der Periodizitätsalgorithmus JTK_CYCLE²³ auf jedem Datensatz ausgeführt wurde und die Schnittmenge der wichtigsten periodischen Gene genommen wurde. Die Gene können jedoch mit jeder beliebigen Methode oder aus der Literatur ausgewählt werden. Diese Gene wurden in der gleichen Reihenfolge für alle drei Bedingungen sowohl für die nicht ausgerichteten (Abbildung 7C) als auch für die ausgerichteten (Abbildung 7D) Heatmaps unter Verwendung der plot_heatmap_comparison Python-Funktion in einem Python-Notebook dargestellt. Diese Heatmaps ermöglichen es, Hunderte von Vergleichen auf Genebene gleichzeitig durchzuführen. Vergleiche zwischen nicht ausgerichteten Experimenten konnten hinsichtlich der Änderung der Kurvendynamik, der Spitzenzeit relativ zu benachbarten Genen und der Periodenlänge usw. durchgeführt werden (Abbildung 7C). Detaillierte phasenspezifische Vergleiche konnten jedoch nicht durchgeführt werden, da die Zeitpunkte nicht unbedingt mit der gleichen Zellzyklusphase unter allen Bedingungen korrelieren. Obwohl die zweiten Zyklen nach der Ausrichtung ähnlich aussahen, waren die ersten Zyklen zwischen den Bedingungen leicht verschoben (Abbildung 7D). Diese Verschiebung könnte die Tatsache widerspiegeln, dass die Informationen über die Phase des knospenden Zellzyklus für Bedingung 3 von geringerer Qualität waren. Nichtsdestotrotz ermöglichte die Ausrichtung der Experimente auf die drei Bedingungen einen verbesserten phasenspezifischen Vergleich. Vor dem Alignment war unklar, ob der erste Expressionspeak in jeder Bedingung in derselben Zellzyklusphase auftreten würde (Abbildung 7C); Nach dem Alignment konnten die Experimente jedoch phasenspezifisch verglichen werden (Abbildung 7D). Vor der Ausrichtung erschienen die Peaks in Zustand 3 viel breiter als in den beiden anderen Bedingungen (Abbildung 7C); Nach der Ausrichtung wurde jedoch deutlich, dass die Spitzen in Bedingung 3 eine ähnliche Breite hatten wie die anderen Bedingungen, wenn sie ausgerichtet waren (Abbildung 7D).

Diese repräsentativen Ergebnisse demonstrieren den Prozess für die Verwendung von CLOCCS, um Experimente auf eine gemeinsame Zeitskala auszurichten. Direkte Zeitpunktvergleiche vor dem Alignment korrelieren oft nicht mit einer ähnlichen Zellzyklusphase. Die Umrechnung der verstrichenen Versuchszeit in Minuten in Lebenslinienpunkte, die die Zellzyklusphase repräsentieren, ermöglicht phasenspezifische und biologisch relevante Vergleiche zwischen Experimenten am gleichen Punkt des Zellzyklus.

Abbildung 1: Übersicht über den Arbeitsablauf für die Ausrichtung von CLOCCS-Seilsicherungen. Der experimentelle Workflow für die Ausrichtung zweier Beispieldatensätze mit CLOCCS, gefolgt von repräsentativen Vergleichen zwischen den Datensätzen. Die wichtigsten Schritte aus dem Protokoll werden veranschaulicht: die Sammlung von nicht ausgerichteten Zellzyklusphasen- und experimentellen Daten für jeden der Datensätze (Schritt 1), die Verwendung von CLOCCS für die Parametrisierung jedes Datensatzes (Schritt 2 und Schritt 3), die Ausrichtung der Datensätze auf eine gemeinsame Lebenslinie (Schritt 4) und schließlich der Vergleich der Zellzyklusphase und der experimentellen Dynamik (Schritt 5 und Schritt 6). Die nicht ausgerichteten Zellzyklus-Phasendaten werden in CLOCCS eingegeben, um gelernte Parameter bereitzustellen, die dann für die Ausrichtung auf eine gemeinsame Lebenslinienskala verwendet werden. Diese ausgerichteten Datensätze werden dann verglichen. Abkürzung: CLOCCS = Characterizing Loss of Cell Cycle Synchrony. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Abbildung 2: Format der Zellzyklusphase und experimentelle Daten, die für den Arbeitsablauf erforderlich sind. Die für den Workflow erforderlichen Daten bestehen aus zwei Hauptkomponenten: Zellzyklus-Phasendaten und experimentelle Zellzyklusdaten. Die Zellzyklusphasendaten können aus Zellzyklus-Knospungsdaten oder durchflusszytometrischen DNA-Inhaltsdaten für jeden Zeitpunkt in der Zeitreihe bestehen. Die experimentellen Daten können viele Formen annehmen, aber in diesem Fall handelt es sich um transkriptomische Daten, die aus Genexpressionsdaten für jedes Gen für jeden Zeitpunkt in der Zeitreihe bestehen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Abbildung 3: Beispiel für die Ergebnisse der Ausführung von CLOCCS auf einem S. cerevisiae-Zellzyklus-Datensatz. (A) Ein Screenshot der grafischen Benutzeroberfläche von CLOCCS mit den Eingabewerten und Einstellungen, die für die Bedingung 2-Knospendaten bereitgestellt werden. Die Zeiten, die Anzahl der nicht geknospeten Zellen und die Anzahl der knospenden Zellen werden eingegeben, ebenso wie der Modelltyp, die Iterationen und Bedingungen usw. (B) Ein Screenshot der resultierenden CLOCCS-Knospung für Bedingung 2 auf der Registerkarte "Predicted Fit" der Ergebnisse. Jedem Datenpunkt ist ein Sampling-Fehlerbalken zugeordnet, der den 95%-Binomialproportions-Konfidenzintervallen der Daten entspricht (für jeden Zeitpunkt wurden mindestens 200 Zellen gezählt [zwischen 204 und 295 Zellen]). Die resultierende Knospenanpassungskurve zeigt das Konfidenzband für das 95%-Konfidenzintervall der CLOCCS-Anpassung in Lila. (C) Ein Screenshot der resultierenden Tabelle "A-posteriori-Parameter" für den CLOCCS-Lauf nach Bedingung 2, bestehend aus den CLOCCS-Parametern im Mittelwert, im 2,5%-Konfidenzintervall und im 97,5%-Konfidenzintervall. Die A-posteriori- und Akzeptanzraten werden ebenfalls angezeigt. (D) Ein Screenshot der Durchflusszytometrie CLOCCS passt für Bedingung 2 nach 70 min und 150 min. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Abbildung 4: Beispiel für den Konvertierungsprozess von Zeitpunkten in ausgerichtete Lebenslinienpunkte für das Dataset Bedingung 2 . (A) Die Umrechnungsformeln, die zum Konvertieren von Zeitpunkten in Lebenslinienpunkte verwendet werden. Ein Screenshot der Python-Funktionen im Python-Notebook zum Konvertieren und Zeichnen der knospenden Kurven. (B) Die nicht ausgerichtete Bedingung 2 Knospkurve, die den Knospungsprozentsatz für jeden Zeitpunkt in Minuten anzeigt. Der Zellzyklus und die Erholungsphasen werden wie folgt hervorgehoben: Erholung (grau), erster Zellzyklus (blau), zweiter Zellzyklus (magenta) und dritter Zellzyklus (lachs). (C) Die ausgerichtete Bedingung 2 Knospkurve, die die gleichen Knospungsprozentsätze zeigt, aber auf der an der Lebenslinie ausgerichteten Skala aufgetragen ist. Die Zellzyklus- und Erholungsphasen sind wie in Tafel C hervorgehoben. (D) Die ausgerichteten Durchflusszytometrie-Diagramme für ausgewählte Zeitpunkte aus Bedingung 2, die verschiedenen Zellzyklusphasen auf der Grundlage der Lebenslinienskala entsprechen: Beginn von G1, Beginn der S-Phase, Beginn von G2/M und Ende G2/M. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Abbildung 5: Repräsentative Ergebnisse für den Vergleich der ausgerichteten und nicht ausgerichteten Condition 1 Replikationsexperimente. Vergleich der Bedingung 1 repliziert: Bedingung 1 RNA-seq (blau), Bedingung 1 Microarray 1 (lila) und Bedingung 1 Microarray 2 (grau). (A) Die nicht ausgerichtete Knospenkurve für die Datensätze von Bedingung 1. (B) Die ausgerichtete Knospenkurve für die Datensätze von Bedingung 1. Die Lebenslinienpunkte wurden in die Zellzyklusphase umgewandelt und sind unterhalb der x-Achse farblich gekennzeichnet. (C) Die nicht ausgerichtete Genexpression eines repräsentativen Gens, CDC20, für die Datensätze der Bedingung 1. (D) Die angepasste Genexpression eines repräsentativen Gens, CDC20, für die Datensätze der Bedingung 1. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Abbildung 6: Repräsentative Ergebnisse für den Vergleich von ausgerichteten und nicht ausgerichteten Zellzyklusphasendaten über Experimente mit unterschiedlichen Zeiträumen. Vergleich der Zellzyklusphasendaten für Datensätze mit drei verschiedenen Umgebungsbedingungen und damit drei verschiedenen Zellzyklusperioden: Condition 1 RNA-seq (Zellzyklusperiode: 71 min), Condition 2 RNA-seq (Zellzyklusperiode: 82 min) und Condition 3 RNA-seq (Zellzyklusperiode: 110 min). (A) Die nicht ausgerichtete Knospenkurve für die Datensätze. (B) Die ausgerichtete Knospenkurve für die Datensätze. (C) Die durchflusszytometrischen DNA-Gehaltshistogramme für Bedingung 2 (obere Reihe) im Vergleich zu den äquivalenten Lebenslinienpunkten in Bedingung 1 (untere Reihe). Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Abbildung 7: Repräsentative Ergebnisse für den Vergleich der alignierten und nicht alignierten transkriptomischen Daten über Experimente mit unterschiedlichen Zeiträumen. Vergleich der transkriptomischen Daten, die mit den Datensätzen in Abbildung 6 verknüpft sind: Bedingung 1 RNA-seq, Bedingung 2 und Bedingung 3. (A) Die nicht ausgerichtete Genexpression eines repräsentativen Gens, CDC20, für die RNA-seq-Datensätze der Bedingungen 1, 2 und 3. (B) Die angeglichene Genexpression von CDC20 für die Datensätze. (C) Die nicht ausgerichtete Heatmap der wichtigsten periodischen Gene des Zellzyklus in der gleichen Reihenfolge für jeden Datensatz. (D) Die auf die Lebenslinie ausgerichteten Heatmaps der gleichen periodischen Gene des Zellzyklus aus Panel C in der gleichen Reihenfolge. Die gestrichelten violetten Linien entsprechen den Lebenslinienpunkten 100 und 200. Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.

Tabelle 1: Phasenumwandlung des Lebenslinienpunkts in den Zellzyklus. Der Umrechnungsschlüssel zwischen der Lebenslinienpunktskala und der entsprechenden Phase im Experiment. Die Lebenslinienpunkte 0-100 entsprechen der Wiederherstellung aus der Synchronität. Alle weiteren 100 Lebenslinienpunkte entsprechen einem neuen Zellzyklus, wobei die ersten 15,5 Lebenslinienpunkte G1, die nächsten 20 der S-Phase und die restlichen Lebenslinienpunkte G2/M entsprechen. Bitte klicken Sie hier, um diese Tabelle herunterzuladen.

Tabelle 2: Knospende CLOCCS-Parameter. Die daraus resultierenden knospenden CLOCCS-Parameter "lambda" und "mu0" für jedes Experiment aus den repräsentativen Ergebnissen. Zusätzlich werden für jedes Experiment die tochterspezifische Verzögerung "Delta" und die berechnete Zellzyklusperiode angezeigt. Bitte klicken Sie hier, um diese Tabelle herunterzuladen.

Tabelle 3: Umrechnungstabelle, die die Umrechnung zwischen Zeitpunkten in Minuten und den entsprechenden Lebensadernpunkten für Bedingung 2 zeigt. Bitte klicken Sie hier, um diese Tabelle herunterzuladen.

Ergänzende Abbildung S1: CLOCCS-Knospung passt zu Bedingung 1 und Bedingung 3. Screenshot der resultierenden CLOCCS-Knospung, die für (A) die RNA-Seq-Knospungsdaten der Bedingung 1, (B) die Bedingung 1 Microarray 1 Knospungsdaten, (C) die Bedingung 1 Microarray 2 Knospungsdaten und für (D) die Bedingung 3 Knospungsdaten geeignet sind. Die CLOCCS-Knospung, die für Bedingung 2 geeignet ist, ist in Abbildung 3B zu sehen. Das 95%-Konfidenzband und die Sampling-Fehlerbalken entsprechen den Beschreibungen in der CLOCCS-Dokumentation^14,15 und in Abbildung 3. Für jeden Zeitpunkt für jede Zeitreihe wurden ca. 200 Zellen gezählt. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung S2: Die CLOCCS-Durchflusszytometrie ist für Bedingung 1 und Bedingung 2 geeignet. Screenshot der Durchflusszytometrie CLOCCS passt für die in Abbildung 6C gezeigten Proben für Bedingung 2 (obere Reihe: A-D) und Bedingung 1 (untere Reihe: E,F). Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Abbildung S3: Sensitivität des Alignments gegenüber Variationen der CLOCCS-Parameter. Vergleich des Alignments des Condition 1 RNA-Seq-Datensatzes unter Verwendung von (A-C)-Variationen in den CLOCCS-Parametern λ und μ0 innerhalb des Konfidenzintervalls der CLOCCS-Anpassung und (D,E) mit großen Variationen in den Parametern. Vergleich zwischen dem Mittelwert und den Konfidenzwerten von 2,5 % und 97,5 %, die CLOCCS in der Parametertabelle für (A) den Parameter μ0, (B) den Parameter λ und (C) für die beiden Parameter μ0 und λ ausgibt. (D) Vergleich zwischen dem Alignment unter Verwendung des Mittelwerts für μ0 und großen Variationen des μ0-Parameters (200 % bis 0,25 % von μ0). (E) Vergleich zwischen dem Alignment unter Verwendung des Mittelwerts für λ im Vergleich zu großen Variationen des λ-Parameters (200 % bis 0,25 % von λ). Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Tabelle S1: Beschreibung der Datenerhebung für jedes Experiment. Für jedes Experiment enthält diese Tabelle eine Beschreibung der knospenden Daten, der Durchflusszytometriedaten, der Transkriptomdaten und der Synchronisationsmethode. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzende Tabelle S2: CLOCCS-Parameter aus den durchflusszytometrischen CLOCCS-Läufen. Die CLOCCS-Parameter "mu0" und "lambda" für die Condition 1 und Condition 2 Durchflusszytometrie CLOCCS läuft. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Ergänzungsdatei 1: Anweisungen für die Konvertierung der durchflusszytometrischen Daten in das CLOCCS-Eingabeformat. Für die Verwendung von CLOCCS mit durchflusszytometrischen Daten ist ein bestimmtes Eingabeformat erforderlich. Diese Datei enthält detailliertere Anweisungen zum Protokollschritt 3.4.1, um zu erklären, wie Sie die Python-Dienstprogrammfunktionen verwenden, um diese Konvertierung durchzuführen. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

In dieser Arbeit wird eine Methode vorgestellt, mit der Daten aus Zeitreihenexperimenten an synchronisierten Zellpopulationen genauer und quantitativ ausgewertet werden können. Die Methode verwendet erlernte Parameter von CLOCCS, einem Bayes'schen Inferenzmodell, das Eingabedaten der Zellzyklusphase, wie z. B. Knospungsdaten und durchflusszytometrische DNA-Inhaltsdaten, verwendet, um jedes Experiment zu parametrisieren^14,15. CLOCCS verwendet die eingegebenen Zellzyklus-Phasendaten, um die Parameter für jedes Experiment abzuleiten, die dann für die Ausrichtung auf eine gemeinsame Lebenslinienskala verwendet werden. Die Konvertierung mehrerer Synchronie-/Freisetzungs-Zeitreihenexperimente in eine einzige, auf die Lebenslinie ausgerichtete Zeitskala ermöglicht phasenspezifische und relevante Vergleiche zwischen Experimenten und die Aggregation mehrerer Wiederholungsexperimente, die zuvor schwierig oder unmöglich waren.

Zu den kritischen Schritten dieses Protokolls gehören das Sammeln der Daten, das Ausführen von CLOCCS, das Ausrichten der Datasets und das Vergleichen zwischen den Datasets. Zunächst müssen Daten für die Verwendung in diesem Protokoll gesammelt werden. Die Daten müssen sowohl aus experimentellen Daten bestehen, die Informationen über die interessierende Fragestellung enthalten (d. h. Transkriptomdaten, Genexpressionsdaten, Proteomikdaten), als auch aus Zellzyklusphasendaten, die Informationen über die Phase des Zellzyklus enthalten (d. h. Knospungsdaten, durchflusszytometrische DNA-Gehaltsdaten). Anschließend können die Phasendaten des Zellzyklus in CLOCCS verwendet werden, um die Parameterinformationen für jedes Experiment zu sammeln. Die Parameter _{μ 0} (Länge der Erholungsphase) und λ (Zyklusperiode der Mutterzelle) werden verwendet, um die Zeitpunkte in Lebenslinienpunkte umzuwandeln. Die Ausrichtung der Lebenslinienpunkte ermöglicht den direkten Vergleich der ausgerichteten Zeitreihen.

Eine Einschränkung der Methode besteht darin, dass die richtige Ausrichtung davon abhängt, ob eine gute Anpassung an die Daten ermittelt werden kann. Das Erreichen der besten CLOCCS-Anpassung hängt von der Qualität der Zellzyklusphasendaten und der Verwendung der richtigen Eingabeeinstellungen für das Experiment in CLOCCS ab. Die Anpassung an die Zellzyklus-Phasendaten bestimmt die Genauigkeit der gelernten Parameter und hat daher einen großen Einfluss auf die Genauigkeit der Ausrichtung, da sie von der Verwendung dieser Parameter abhängt. Da weitreichende Änderungen der Parameter die Ausrichtung stark beeinflussen würden, bleiben die Änderungen innerhalb des in der CLOCCS-Ausgabe angegebenen Konfidenzintervalls minimal (ergänzende Abbildung S3). Es ist wichtig zu beachten, dass diese Empfindlichkeit gegenüber Variationen der Parameter auch die Ausrichtung zwischen Datensätzen mit unterschiedlichem Zellzyklus-Timing ermöglicht.

Die Genauigkeit der CLOCCS-Anpassung kann anhand der resultierenden CLOCCS-Anpassungskurve und der entsprechenden Fehlerbalken und des Fehlerbandes bestimmt werden (Abbildung 3B, D, ergänzende Abbildung S1 und ergänzende Abbildung S2). Auf der Registerkarte CLOCCS-Anpassung werden die ursprünglichen Datenpunkte sowie die CLOCCS-Anpassungskurve angezeigt, wobei das Konfidenzband dem Konfidenzintervall der CLOCCS-Anpassung entspricht, und die Fehlerbalken, die dem 95%-Binomialanteilskonfidenzintervall der Daten entsprechen, da die Zählungen als unabhängige binomiale Zufallsvariablen¹⁴ angenommen werden. Beispielsweise messen die Konfidenzbalken in den knospenden Daten das Vertrauen in den Anteil der knospenden Zellen für eine bestimmte Stichprobe.

Eine Methode zum Bestimmen der Qualität der CLOCCS-Anpassung besteht darin, zu bestimmen, ob sich die Fehlerbalken der Daten mit dem Konfidenzintervallband der CLOCCS-Anpassung überlappen. Ein weiteres Indiz ist die Breite des 95%-Konfidenzbandes der CLOCCS-Passform. Im Allgemeinen nimmt die Breite des Bandes mit zunehmender Passform ab. Ein Hinweis auf eine schlechte Ausrichtung liegt vor, wenn die Zellzyklusphase der Originaldaten nicht mit der aus der Ausrichtung abgeleiteten Zellzyklusphase übereinstimmt. Jede Ausrichtung kann doppelt überprüft werden, indem bestätigt wird, dass für jeden Zeitpunkt die durch die Zellzyklusphaseninformationen angezeigten Phasendaten mit der durch die Ausrichtung zugewiesenen Zellzyklusphase übereinstimmen.

Eine schlechte CLOCCS-Passung oder eine schlechte Ausrichtung könnte das Ergebnis von qualitativ minderwertigen Zellzyklusphasendaten sein. Qualitativ hochwertige Daten weisen unmittelbar nach der Verhaftung einen sehr niedrigen Prozentsatz an Knospungen und am ersten Spitzenwert einen sehr hohen Prozentsatz an Knospen auf. Die nachfolgenden Spitzen und Täler verlieren ihre Synchronität, sollten aber deutlich und gleichmäßig verteilt sein. Da die Lebenslinienpunkte die durchschnittliche Zellzyklusphase der Population darstellen, kann eine schlechte Synchronisation auch die richtige Ausrichtung behindern. Qualitativ hochwertige durchflusszytometrische DNA-Gehaltsdaten weisen für jeden Zeitpunkt unterschiedliche 1C- und 2C-Peaks auf, die der entsprechenden Zellzyklusphase entsprechen. Darüber hinaus führen unzureichende Zellzyklus-Phasendaten zu Problemen bei der Identifizierung von Parametern. Bei ausreichenden Daten können die Parameter abgeleitet werden und ändern sich zwischen den CLOCCS-Ausführungen nicht wesentlich. Die in diesem Protokoll beschriebenen Parameter (Lambda, Delta, mu0) können jedoch nicht entwirrt werden, wenn die Zellzyklusphasendaten nur einen vollständigen Zellzyklus enthalten. Um eine verbesserte Parameterschätzung zu ermöglichen, sollten ausreichende und gut konstruierte Zellzyklusdaten für die CLOCCS-Fits^14,15 verwendet werden. Darüber hinaus verwendet das CLOCCS-Modell frühere Informationen, wie in Orlando et ^al.15 beschrieben, aber diese Informationen können angepasst werden, um besser an die verwendeten experimentellen Bedingungen anzupassen.

Wenn die Qualität der Zellzyklus-Phasendaten gut ist, kann eine erneute Anpassung der CLOCCS-Einstellungen dazu beitragen, eine genauere Anpassung zu erzielen. Beispielsweise könnte die Anzahl der ausgewählten Iterationen erhöht werden, um die Genauigkeit zu verbessern. Die Bestätigung, dass die richtige Synchronisationsmethode in CLOCCS ausgewählt wurde, kann ebenfalls nützlich sein, da der Alpha-Faktor-Arrest im Vergleich zur Abschlämmung mit einer kürzeren Erholungszeit verbunden ist.

Diese Methode ist auch in Bezug auf die Arten von Zellzyklusphasendaten, die derzeit unterstützt werden, begrenzt. CLOCCS ist jedoch flexibel und kann an die Unterstützung anderer Datentypen angepasst werden. Zum Beispiel wurde CLOCCS bereits angepasst, um die Fluoreszenzmarkierung von Spindelpolkörpern, Myosinringen und Zellkernen¹¹ für die Verwendung als Zellzyklus-Phasenkenner zu unterstützen. Darüber hinaus wurde der Einsatz von CLOCCS mit anderen Arten als S. cerevisiae ermöglicht. CLOCCS akzeptiert Septierungsindizes als Marker für die Zellzyklusphase in S. pombe¹⁴ sowie durchflusszytometrische DNA-Gehaltsdaten, die für viele Spezies leicht zu sammeln sind¹⁵. Dies ermöglicht den Vergleich von experimentellen Daten in der gleichen Phase des Zellzyklus für zwei völlig unterschiedliche Spezies und kann Einblicke in Veränderungen im Zellzyklus im Laufe der Evolution geben.

Obwohl nur unterstützte Formen von Zellzyklus-Phasendaten mit dieser Lifeline-Alignment-Methode verwendet werden können, ist diese Methode unabhängig von der Art der verwendeten experimentellen Zeitreihendaten. In diesem Protokoll haben wir seine Verwendung bei der Angleichung der Genexpression eines einzelnen Gens sowie von Zeitreihen-Transkriptomdaten für Hunderte von Genen im Tandem demonstriert. Wir haben gezeigt, dass diese Methode verwendet werden kann, um plattformübergreifend zu vergleichen und somit Vergleiche zwischen RNA-seq-Datensätzen und Microarray-Datensätzen anzustellen, die unter ähnlichen Bedingungen aufgenommen wurden. Wir haben auch gezeigt, dass diese Methode verwendet werden kann, um Datensätze mit verschiedenen Synchronisationsmethoden abzugleichen, indem wir einen Datensatz, der elutriiert wurde (Bedingung 1 Microarray), mit einem Datensatz vergleichen, der mit Alpha-Faktor verhaftet wurde (Bedingung 1 RNA-seq). Zuvor wurde CLOCCS auch verwendet, um Zeitreihen-Transkriptom- und Zeitreihen-Proteomik-Daten unter Verwendung von Phasendaten des knospenden Zellzyklus^{abzugleichen 22}, was direkte Vergleiche zwischen der mRNA-Dynamik und der Dynamik des entsprechenden Proteins ermöglichte. CLOCCS wurde auch verwendet, um Zeitreihendaten zwischen verschiedenen Arten abzugleichen, z. B. für das Alignment zwischen S. cerevisiae und S. pombe¹⁴ und zwischen dem ersten Zyklus von S. cerevisiae und der pathogenen Hefe Cryptococcus neoformans²¹. Schließlich ist das CLOCCS-Alignment derzeit spezifisch für Zellzyklus-Zeitreihendaten und wurde noch nicht für die Verwendung mit anderen Arten von rhythmischen Prozessen angepasst. Ein Bereich, in dem dies von besonderem Interesse wäre, ist der circadiane Rhythmus, bei dem die circadiane Zeit (CT) herkömmlicherweise verwendet wird, um Experimente aufeinander abzustimmen, obwohl ihre Implementierung nicht konsequent angewendet wird. Ein weiteres Interessengebiet ist die Untersuchung von Entwicklungsrhythmen, wie z.B. des Malariaparasiten. Zum Beispiel würde die Ausrichtung von Plasmodium falciparum-Stämmen auf verschiedene Perioden, wie sie in Smith et ^al.25 beschrieben ist, detailliertere Vergleiche zwischen den Stämmen ermöglichen. Die Angleichung dieser periodischen Prozesse zum Vergleich würde ein besseres Verständnis dieser wichtigen rhythmisch-biologischen Funktionen ermöglichen. Diese Art von Zellzyklusvergleichen wurde durch die Verwendung von CLOCCS für die Ausrichtung der Lebenslinie ermöglicht, wie in diesem Protokoll beschrieben.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren haben keine Interessenkonflikte offenzulegen.

Acknowledgments

S. Campione und S. Haase wurden von der National Science Foundation (DMS-1839288) und den National Institutes of Health (5R01GM126555) unterstützt. Darüber hinaus bedanken sich die Autoren bei Huarui Zhou (Duke University) für Kommentare zum Manuskript und für den Beta-Test des Protokolls. Wir danken auch Francis Motta (Florida Atlantic University) und Joshua Robinson für ihre Hilfe beim Java-Code.

Materials

Name	Company	Catalog Number	Comments
2x PBS			For Fixative Solution. Described in Leman 2014.
4% formaldehyde			For Fixative Solution.
100% Ethanol			For flow cytometry fixation. Described in Haase 2002.
CLOCCS			https://gitlab.com/haase-lab-group/cloccs_alignment.git
Flow Cytometer			For flow cytometry protocol.
Git			https://git-scm.com/
Java 19			https://www.oracle.com/java/technologies/downloads/#java19
Microscope			For counting cells and buds.
Miniconda			https://docs.conda.io/en/latest/
Protease solution			For flow cytometry protocol. Described in Haase 2002.
RNAse A solution			For flow cytometry protocol. Described in Haase 2002.
SYTOX Green Nucleic Acid Stain	Invitrogen	S7020	For flow cytometry staining. Described in Haase 2002.
Tris			pH 7.5

DOWNLOAD MATERIALS LIST

References

Tyers, M., Tokiwa, G., Futcher, B. Comparison of the Saccharomyces cerevisiae G1 cyclins: Cln3 may be an upstream activator of Cln1, Cln2 and other cyclins. EMBO Journal. 12 (5), 1955-1968 (1993).
Schwob, E., Nasmyth, K. CLB5 and CLB6, a new pair of B cyclins involved in DNA replication in Saccharomyces cerevisiae. Genes and Development. 7, 1160-1175 (1993).
Polymenis, M., Schmidt, E. V. Coupling of cell division to cell growth by translational control of the G1 cyclin CLN3 in yeast. Genes and Development. 11 (19), 2522-2531 (1997).
Spellman, P. T., et al. Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization. Molecular Biology of the Cell. 9 (12), 3273-3297 (1998).
Cho, R. J., et al. A genome-wide transcriptional analysis of the mitotic cell cycle. Molecular Cell. 2 (1), 65-73 (1998).
Bar-Joseph, Z. Analyzing time series gene expression data. Bioinformatics. 20 (16), 2493-2503 (2004).
Pramila, T., Wu, W., Miles, S., Noble, W. S., Breeden, L. L. The Forkhead transcription factor Hcm1 regulates chromosome segregation genes and fills the S-phase gap in the transcriptional circuitry of the cell cycle. Genes and Development. 20 (16), 2266-2278 (2006).
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Nash, R., Tokiwa, G., Anand, S., Erickson, K., Futcher, A. B. The WHI1+ gene of Saccharomyces cerevisiae tethers cell division to cell size and is a cyclin homolog. EMBO Journal. 7 (13), 4335-4346 (1988).
Basco, R. D., Segal, M. D., Reed, S. I. Negative regulation of G1 and G2 by S-phase cyclins of Saccharomyces cerevisiae. Molecular and Cellular Biology. 15 (9), 5030-5042 (1995).
Mayhew, M. B., Robinson, J. W., Jung, B., Haase, S. B., Hartemink, A. J. A generalized model for multi-marker analysis of cell cycle progression in synchrony experiments. Bioinformatics. 27 (13), 295-303 (2011).
Qu, Y., et al. Cell cycle inhibitor Whi5 records environmental information to coordinate growth and division in yeast. Cell Reports. 29 (4), 987-994 (2019).
Di Talia, S., Skotheim, J. M., Bean, J. M., Siggia, E. D., Cross, F. R. The effects of molecular noise and size control on variability in the budding yeast cell cycle. Nature. 448 (7156), 947-951 (2007).
Orlando, D. A., et al. A probabilistic model for cell cycle distributions in synchrony experiments. Cell Cycle. 6 (4), 478-488 (2007).
Orlando, D. A., Iversen, E. S., Hartemink, A. J., Haase, S. B. A branching process model for flow cytometry and budding index measurements in cell synchrony experiments. Annals of Applied Statistics. 3 (4), 1521-1541 (2009).
Duan, F., Zhang, H. Correcting the loss of cell-cycle synchrony in clustering analysis of microarray data using weights. Bioinformatics. 20 (11), 1766-1771 (2004).
Darzynkiewicz, Z., Halicka, H. D., Zhao, H. Cell synchronization by inhibitors of DNA replication induces replication stress and DNA damage response: analysis by flow cytometry. Methods in Molecular Biology. 761, 85-96 (2011).
Leman, A. R., Bristow, S. L., Haase, S. B. Analyzing transcription dynamics during the budding yeast cell cycle. Methods in Molecular Biology. 1170, 295-312 (2014).
Rosebrock, A. P. Synchronization and arrest of the budding yeast cell cycle using chemical and genetic methods. Cold Spring Harbor Protocols. 2017 (1), (2017).
Haase, S. B., Reed, S. I. Improved flow cytometric analysis of the budding yeast cell cycle. Cell Cycle. 1 (2), 132-136 (2002).
Kelliher, C. M., Leman, A. R., Sierra, C. S., Haase, S. B. Investigating conservation of the cell-cycle-regulated transcriptional program in the fungal pathogen, Cryptococcus neoformans. PLoS Genetics. 12 (12), e1006453 (2016).
Kelliher, C. M., et al. Layers of regulation of cell-cycle gene expression in the budding yeast Saccharomyces cerevisiae. Molecular Biology of the Cell. 29 (22), 2644-2655 (2018).
Hughes, M. E., Hogenesch, J. B., Kornacker, K. JTK_CYCLE: An efficient nonparametric algorithm for detecting rhythmic components in genome-scale data sets. Journal of Biological Rhythms. 25 (5), 372-380 (2010).
Deckard, A., Anafi, R. C., Hogenesch, J. B., Haase, S. B., Harer, J. Design and analysis of large-scale biological rhythm studies: A comparison of algorithms for detecting periodic signals in biological data. Bioinformatics. 29 (24), 3174-3180 (2013).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Biology

Abgleich von synchronisierten Zeitreihendaten unter Verwendung des Modells zur Charakterisierung des Zellzyklusverlusts für experimentübergreifende Vergleiche

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.