Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

Erleichterung der Analyse der immunologischen Daten mit Visual analytischen Techniken

Published: January 2, 2011 doi: 10.3791/2397

Summary

Visual Analytics (VA) ist ein neuer Ansatz zur Analyse von Daten interaktiv. In diesem Video sprechen wir die Daten Überlastung Problem durch High-Throughput-biologische Experimente gebracht werden, und schlagen VA als eine Lösung für dieses Problem nicht. Das Video demonstriert Analyse innerhalb und zwischen den immunologischen Datensätze mit einem VA-Tool namens Tableau.

Abstract

Visual Analytics (VA) hat als einen neuen Weg, um große Datensätze durch interaktive Visualisierung analysieren entstanden. Wir zeigten den Nutzen und die Flexibilität eines VA-Ansatz in der Analyse von biologischen Datensätzen. Beispiele für diese Datensätze in der Immunologie zählen Durchflusszytometrie, Luminex Daten und Genotypisierung (zB Single-Nukleotid-Polymorphismus)-Daten. Im Gegensatz zu den traditionellen Informationsvisualisierung Ansatz, stellt die Analyse VA Macht in den Händen von Analysten, indem der Analytiker in Echtzeit Daten Exploration Prozess zu engagieren. Wir haben uns für die VA Software namens Tableau nach der Auswertung mehrerer VA-Tools. Zwei Arten der Analyse Aufgaben Analyse innerhalb und zwischen den Datensätzen wurden in der Video-Präsentation mit einem Ansatz namens gepaart Analyse nachgewiesen. Gepaart Analyse, wie in VA definiert, ist eine Analyse-Ansatz, in dem ein VA-Tool-Experte arbeitet Seite an Seite mit einem Domain-Experte bei der Analyse. Die Domain-Experte ist derjenige, der die Bedeutung der Daten versteht, und stellt die Fragen, die die gesammelten Daten könnten Adresse. Das Tool-Experte erstellt dann Visualisierungen zu helfen, finden Sie Muster in den Daten, die diese Fragen beantworten könnte. Die kurze Verzögerungszeit zwischen der Hypothese Generation und die schnelle visuelle Darstellung der Daten ist der Hauptvorteil eines VA-Ansatz.

Protocol

1. Exploration-based Analysis auf Tableau

  1. Sie haben einen Datensatz, und Sie möchten die verschiedenen Beziehungen zwischen den Spalten in den Daten zu entdecken.
    1. (Abbildung 1) Import des Datensatzes durch einen Klick auf "Daten Connect '. Wählen Sie den Typ der Datenquelle und folgen Sie den Anweisungen auf Ihrem Datensatz zu importieren.
    2. (Abbildung 1) Stellen Sie sicher, dass die Abmessungen Regal kategorische Spalten enthält, während die Maßnahmen Regal enthält numerische Spalten aus Ihrem Datenbestand. Manchmal ist eine Dimension Spalte, z. B. Thema Kennung kann als Maßnahme aufgeführt werden, wenn sie nummeriert. Ändern Sie die Abmessungen mit der rechten Maustaste darauf und wählen "Convert to Dimension". In Abbildung 1 sind kategorische Spalten aus dem Datensatz wie etwa Stimulus Konzentration und unterliegen Identifikatoren korrekt in Dimensionen Regal gestellt, und die beobachtete Konzentration der Zytokine sind korrekt in Maßnahmen Regal gestellt.
    3. (Abbildung 2) Wenn bei der Analyse-Prozess, ein berechnetes Feld benötigt wird, einfach mit der rechten in beiden Dimensionen oder Maßnahmen Regal klicken, und wählen Sie "Create Berechnetes Feld". Geben Sie die Berechnung in der Formel-Box mit Feldern mit Funktionen oder mathematische Operationen kombiniert. Abbildung 2 zeigt, wie man ein neues Feld namens PFD> 2 durch Aggregation PFD2, PFD3 und PFD4 Werte zu schaffen.
    4. (Abbildung 3) Erzeugen Sie eine 2-D Plot in Tableau, in der Regel mit einer Dimension und ein gewisses Maß an Interesse. Da die Schnittstelle bietet eine einfache Drag-and-Drop-Interaktion, kann die Wahl der Dimension und messen leicht geändert werden. Die Abmessungen sind in der Regel in Spalten Regal, und Maßnahmen in den Reihen Regal gestellt. In Abbildung 3 enthält die Abmessungen Regal Stimulus Konzentration, und die Maßnahmen Regal enthält beobachtet Konzentration von Zytokinen.
    5. (Abbildung 3) Um die Visualisierung durch eine spezifische Dimension, statt zu differenzieren, dass Bemassungstext in Text, Farbe oder Größe Regal, je nach Art der Dimension. Text Regal versucht, Daten in die Visualisierung durch Etikettierung sie mit Textinformationen durch die Dimension ausgewählt vorgesehen unterscheiden. Farbe und Größe Regal wird automatisch unterschieden Daten nach Farbe und Größe, die mit dem Scroll-Leiste am unteren Rand jeder Regal befindet eingestellt werden kann. In Abbildung 3, indem Genotyp in Farbe Regal führt zur Trennung der drei Genotypen durch verschiedene Farben.
    6. (Abbildung 3) Filter die Visualisierung durch die spezifische Spalte Variablen in anderen Dimensionen. Dies kann durch Ziehen der Dimension Label in den Filter Regal durchgeführt werden. Es wird ein Fenster mit der Liste der Werte zur Auswahl angezeigt. Der gewählte Wert wird nur blieben die Werte in der Visualisierung.
    7. (Abbildung 4) können Sie die Visualisierung mit anderen Dimension zu kombinieren oder zu messen, um eine Matrix der Visualisierung zu erzeugen. Dies kann durch Fallenlassen mehreren Dimensionen in den Spalten Regal, und mehrere Maßnahmen in Reihen Regal durchgeführt werden. Abbildung 4 enthält ein Beispiel für Zwei-Säulen-Visualisierung Matrix, indem Sie zwei unterschiedliche Dimensionen in den Spalten Regal.
    8. Um eine vergleichbare Darstellung, direkt an der aktuellen Tabelle auf der linken unteren Ecke klicken, und ausgewählte "Duplikat Blatt".
    9. Iterate den Analyseprozess zu interessanten Trends und Ausreißer, die Ihnen helfen zu generieren neue Hypothese über die Daten zu identifizieren.
  2. Sie haben mehrere Datensatz aus der gleichen Quelle erzeugt wird, und wollen die möglichen Verbindungen zwischen diesen Datensätzen zu entdecken.
    1. Legen Sie mehrere Datensätze in einer gleichen Quelle, dh Platz zwei Tabellen in derselben Arbeitsmappe, damit Tableau, auf diese Datenmenge durch die gleiche Verbindung zu verbinden.
    2. (Abbildung 5) Schließen Sie die Datensätze durch logische Verknüpfung der zentralen Werte, um sicherzustellen, dass die Dimensionen, die das gleiche für mehrere Datensätze ausgewählt werden. In Abbildung 5 gibt es fünf zentrale Werte für den Beitritt: Zelltyp, Stimulus Konzentration, Bühne oder Gruppe, Reiz und vorbehaltlich Kennung.
    3. Durchführen von Analysen ähnlich Abschnitt 1.1.

2. Presentation-based Needs

  1. Sie kennen die Beziehungen zwischen Daten, aber Sie wollen in der Lage sein, schnell eine Liste von Visualisierungen für den Einsatz in der Präsentation.
    1. Follow-Protokoll in Abschnitt 1.1 beschrieben, und kommentieren Sie die Visualisierungen entsprechend.
    2. Verwenden Sie die Export-Funktion in Tableau von Bildern von Visualisierungen zu produzieren.
  2. Sie haben einen mächtigen Satz von Visualisierungen in Tableau Arbeitsmappe erstellt und möchte, dass Arbeitsmappe freigeben.
    1. Speichern Sie die Arbeitsmappe als Tableau verpackt Arbeitsmappe und teilen Sie diese Datei.
    2. Kollegen ohne Tableau Desktop kann download Tableau Reader, um die verpackten Arbeitsmappe öffnen. Tableau Reader ermöglicht Ihren Mitarbeitern, mit den Visualisierungen, die Sie erstellt haben, zu interagieren.

3. Repräsentative Ergebnisse

Abbildung 1
Abbildung 1. Ein Screenshotvon Tableau nach dem Import der Tabellenkalkulation namens NFKBIA aus der Excel-Datei demo.xls. Die Dimensionen und Kennzahlen Regale waren richtig mit dem kategorischen und numerischen Daten gefüllt, bzw..

Abbildung 2
Abbildung 2. Berechneten Feld Fenster wird aufgerufen, um ein spezielles berechnetes Feld erstellen, um in Tableau verwenden. Die Liste auf der linken unteren Feld hilft bei der Identifizierung möglichen Bereichen, und die Liste auf der rechten Seite enthält Abkürzung von Funktionen, die in der Formel verwendet werden können. In diesem Beispiel wollten wir die Werte für PFD4, PFD3 und PFD2 hinzufügen, um den endgültigen Wert, dass wir als PFD> 2 erhalten

Abbildung 3
Abbildung 3. Visualisierung von Stimulus Konzentration vs beobachtet Zytokin-Konzentration. Die Visualisierung zeigt eine grafische Darstellung der verschiedenen Konzentrationen des Stimulus 3M-002 gegen die beobachtete Konzentration der Zytokine TNF-α. Die Farben der Linien beziehen sich auf die unterschiedlichen Genotypen für eine Single-Nukleotid-Polymorphismus im Gen NFKBIA der Individuen in unserer angeborenen Immunsystems zu untersuchen.

Abbildung 4
Abbildung 4. Ein Screenshot von einer Zwei-Säulen-Visualisierung Matrix. Wir erzeugten eine Zwei-Säulen-Matrix zu einem Side-by-Side-Vergleich der Antworten auf zwei Reize, 3M-003 und LPS zu erleichtern. Die x-Achse sind die verschiedenen Konzentrationen der beiden Reize, und die y-Achse zeigt die Werte des berechneten Feldes, PFD> 2.

Abbildung 5
Abbildung 5. Diese Tableau Dialog-Fenster zeigen, wie die Daten in verschiedenen Tabellen aufgenommen zu verbinden. Einbinden von Daten aus verschiedenen Tabellen können durch die Kombination dieser mit logischen Join-Klauseln der wichtigsten Werte erreicht werden.

Visualisierung und Analyse-Tool
Funktion Bild VIS-STAMP xmdvtool Ggobi Sternenlicht Gapminder Visulab InfoVis Toolkit Geotime Inspirieren
Parallel zu koordinieren Grundstücke Ja Ja Ja Ja Ja Nicht Ja Ja Nicht Nicht
Streudiagramm-Matrizen Ja Nicht Ja Ja Ja Nicht Ja Nicht Nicht Nicht
Dimensional Reduktion Nicht Nicht Ja Ja Nicht Nicht Nicht Nicht Nicht Nicht
Zeitlichen Dimensionen Ja Ja Nicht Ja Ja Ja Nicht Ja Ja Nicht
Geospatial Dimensionen Ja Ja Nicht Nicht Ja Ja Nicht Nicht Ja Nicht
Text-Mining Nicht Nicht Nicht Nicht Ja Nicht Nicht Nicht Nicht Ja
Die direkte Manipulation von Daten Ja Ja Ja Ja Ja Ja Ja Nicht Ja Nicht
Filtering Ja Ja Ja Ja Ja Ja Ja Nicht Ja Ja
Erweiterbarkeit auf andere Plattformen (zB R) Ja Nicht Ja Ja Nicht Ja Nicht Ja Nicht Nicht
CSV-Tabelle Formate Ja Ja Ja Ja Nicht Nicht Ja Ja Ja Nicht
XML-Datenformate Ja Nicht Nicht Ja Ja Nicht Ja Ja Ja Nicht
Kann mit 1 Deal0000 + Zeilen Ja Nicht Nicht Nicht Ja Nicht Nicht Nicht Nicht Ja
Dokumentation Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
Kommerzielles Produkt Ja Nicht Nicht Nicht Ja Nicht Nicht Nicht Ja Ja

Tabelle 1. Liste der Visual Analytics-Tools und einige ihrer Funktionen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Das Aufkommen von High-Throughput-Technologien in der modernen biomedizinischen Forschung führte zu einer Explosion der Forschung Daten, die eine effizientere Methode zur Analyse erfordert. Visual Analytics (VA) ist die Wissenschaft der analytischen Argumentation interaktiven visuellen Schnittstellen (1) erleichtert. Die VA-Ansatz stellt die analytische Kraft in den Händen der Menschen Analyst, im Gegensatz zu den traditionellen Ansatz, um Muster von Computer zu erkennen. Visual Analytics hat Forschung in verschiedenen Bereichen wie Verteidigung der Forschung (1) und Hurrikan-Trends (2) angewendet. Bisher gibt es nur ein paar Beispiele für VA-Anwendungen in der Biologie (3). Wir haben gezeigt, in diesem Video Artikel, der VA ein Ansatz, der Biologe Arsenal von Analyse-Tools hinzugefügt werden kann. Viele VA Software stehen zur Verfügung von denen, die in Entwicklung sind in akademischen Labors für jene, die kommerziell verfügbar sind. Für unsere Arbeit auf die neonatale angeborene Immunität (4), entschieden wir uns für Tableau wegen ihrer Eignung zur Analyse Tabellenkalkulation-style-Datensätze in das Labor. Andere VA-Tools, von denen wir einige in unserer Video-Artikel erwähnt wird, kann es sinnvoller sein für andere Arten von biologischen Daten. Wir listeten die Funktionen und Eigenschaften einiger der beliebtesten VA-Tools in Tabelle 1. Diese Liste ist nicht erschöpfend, weil sie über den Rahmen unserer Studie ist, aber es sollte ein guter Ausgangspunkt für Wissenschaftler sein, um die geeigneten VA-Tool für ihre spezifische Datensätze zu bestimmen.

Es gibt zwei wichtige Punkte über VA, die wir gerne hervorheben möchte. Einer ist der VA-Ansatz als eine Erforschung Prozess, indem der Analytiker schnell Spotmuster wie allgemeine Trends und Ausreißern in den Daten bestimmt. Der Schwerpunkt der VA ist es, eine leistungsfähige Visualisierungs-Technik für große Datenmengen bieten. Es ist nicht eine Alternative zur statistischen Analyse. In der Tat sind die meisten der VA-Tools sehr in ihrer Fähigkeit, statistische Analysen durchführen, obwohl wir dies in naher Zukunft ändern rechnen begrenzt. Der zweite Punkt, den wir erwähnen möchte, ist, dass die Daten-Vorverarbeitung vor dem Import des Datensatzes zu einem VA-Tool entscheidend für den Erfolg der Analyse ist. Denken Sie daran, dass die Daten in eine lesbare Weise in Tabellen präsentiert manchmal unterscheiden sich von einem maschinenlesbaren Format. Vorverarbeitung der Daten kann ein zeitaufwändiger Schritt sein und erfordert oft massiven Transformation der Daten, wenn das ursprüngliche Format der Daten ist nicht geeignet, um die VA-Tool. Wir empfehlen dringend, die sorgfältige Planung der Datenerfassung und-Codierung, um flexible und effiziente Uploads an nachgeschaltete Analyse-Software-Tools, wie jene, in VA ermöglichen.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Keine Interessenskonflikte erklärt.

Acknowledgments

Wir möchten die Mitglieder des Vancouver Institute of Visual Analytics (VIVA) für das Anbieten Kommentare und Ratschläge für das Projekt danken. Insbesondere möchten wir John Dill, Brian Fisher, und David Darvill danken. Wir möchten auch die Mitglieder des Kollmann Labor für ihre Unterstützung und hilfreiche Diskussionen danken. Diese Arbeit wurde teilweise durch National Institute of Allergy and Infectious Diseases, National Institute of Health Grants N01 AI50023 unterstützt; Allergen NCE Grants 07-A1A und 07-B2B, und die Michael Smith Foundation for Health Research. TRK ist zum Teil durch ein Career Award in der Biomedical Science an der Burroughs Wellcome Fund einer Anzeige von einer kanadischen Institute for Health Research Training Grant in kanadischen Child Health Clinician Scientist Program, in Zusammenarbeit mit Sick-Kids-Stiftung, Kinder-und Family Research Institute unterstützt ( British Columbia), Frauen und Kinder Health Research Institute (Alberta) und Manitoba Institute of Child Health.

References

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Tags

Immunologie Visual Analytics Durchflusszytometrie Luminex Tableau Zytokin angeborene Immunität Einzel-Nukleotid-Polymorphismus
Erleichterung der Analyse der immunologischen Daten mit Visual analytischen Techniken
Play Video
PDF DOI

Cite this Article

Shih, D. C., Ho, K. C., Melnick, K.More

Shih, D. C., Ho, K. C., Melnick, K. M., Rensink, R. A., Kollmann, T. R., Fortuno III, E. S. Facilitating the Analysis of Immunological Data with Visual Analytic Techniques. J. Vis. Exp. (47), e2397, doi:10.3791/2397 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter