Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

Содействие Анализ иммунологических данных с визуальными Аналитические методы

Published: January 2, 2011 doi: 10.3791/2397

Summary

Визуальный аналитики (VA) представляет собой новый подход анализа данных в интерактивном режиме. В этом видео, мы обсуждаем проблемы перегрузки данных вызванные высокой пропускной биологические эксперименты, и предложить В.А. в качестве решения такой проблемы. Видео показывает анализ внутри и между наборами данных иммунологических использованием В. А. инструмент под названием таблицы.

Abstract

Визуальный аналитики (VA) появился как новый способ анализа больших наборов данных с помощью интерактивного визуального отображения. Мы показали полезность и гибкость В. А. подход в анализе биологических данных. Примерами таких данных в иммунологии включают проточной цитометрии, Luminex данных и генотипирование (например, одиночных нуклеотидных полиморфизма) данных. В отличие от традиционного подхода визуализации информации, В. А. восстанавливает анализ власти в руках аналитика, позволяя аналитикам заниматься в режиме реального времени процесс исследования данных. Мы выбрали программное обеспечение под названием В. А. Таблицы после оценки нескольких В. А. инструментов. Два вида анализа задач анализа внутри и между наборами данных были продемонстрированы в видео-презентации с использованием подхода, называемого парного анализа. Парный анализ, как это определено в В.А., является анализ подход, при котором В. А. эксперта инструмент работает бок о бок с эксперт предметной области во время анализа. Эксперт предметной области является тот, кто понимает значение данных и задает вопросы, что собранные данные могли бы решить. Инструмент Эксперт затем создает визуализацию, чтобы помочь найти закономерности в данных, которые могли бы ответить на эти вопросы. Короткий промежуток времени между поколения гипотезы и быстрого визуального отображения данных является основным преимуществом В. А. подход.

Protocol

1. Исследование основе анализа на Tableau

  1. У вас есть набор данных, и вы хотите, чтобы изучить различные отношения между столбцами в данных.
    1. (Рис. 1) Импорт данных, нажав на "Подключение к данным". Выберите тип источника данных и следуйте инструкциям, чтобы импортировать набор данных.
    2. (Рис. 1) Убедитесь, что размеры полки содержит категорический столбцов в то время как меры шельфе содержит числовые столбцы из набора данных. Иногда столбец измерения, например, тема идентификатор может быть указан как меру, если она пронумерованы. Замените ее на размеры, щелкнув правой кнопкой мыши и выберите "Преобразовать в измерении". На рисунке 1, категорический столбцов из набора данных, таких как стимул уровня концентрации и при условии идентификаторы правильно расположены на шельфе размеры, и наблюдается концентрация цитокинов правильно помещены в полку мер.
    3. (Рис. 2) Если в процессе анализа, вычисляемого поля необходимо, просто щелкните правой кнопкой мыши в любом размеры или меры, полки, и выберите "Создать вычисляемое поле. Входной расчета в формуле поле с полями в сочетании с функциями или математических операций. На рисунке 2 показано, как создать новое поле называется ПФО> 2 путем агрегирования PFD2, PFD3 и PFD4 ценностей.
    4. (Рис. 3) Создание 2-D участок в Таблицы, как правило, с размерностью и мера интерес. Так как интерфейс предлагает просто перетаскивая их мышью взаимодействия, выбор размера и меру можно легко изменить. Размеры, как правило, помещают в колонны полка, а также меры в шельфовых строк. На рисунке 3, размеры полки содержит уровне стимулов концентрации, и меры шельфе содержит наблюдаемый уровень концентрации цитокинов.
    5. (Рис. 3) Чтобы отличать визуализации на конкретные измерения, место, размер этикетки на шельфе текст, цвет или размер, в зависимости от характера измерения. Текст шельфе попытки дифференцировать данные визуализации, присваивая им метки с текстовой информации, предоставленной измерения выбрана. Цвет и размер полки автоматически различать данные по цвету и размеру, которые могут быть скорректированы с полосой прокрутки расположена в нижней части каждой полке. На рисунке 3, размещение генотипа в цвете шельфа приводит к выделению трех генотипов по разные цвета.
    6. (Рис. 3) Фильтры визуализации на конкретных переменных столбца в другое измерение. Это может быть сделано путем перетаскивания измерение этикетки в фильтр полке. Появится окно со списком значений на выбор. Выбранное значение будет только значения, оставшихся в визуализации.
    7. (Рис. 4) Вы можете объединить визуализации с другом измерении или меру, чтобы произвести матрицу визуализации. Это может быть сделано путем отказа от многочисленных измерений на шельфе столбцов, а также несколько мер в полку строк. На рисунке 4 приведен пример двух столбцов матрицы визуализации путем размещения двух различных размеров в полку столбцов.
    8. Для получения аналогичного визуализации, правой кнопкой мыши на текущем листе в нижнем левом углу, и выбрал "Копия листа».
    9. Итерация процессе анализа выявить интересные тенденции или значений, которые могут помочь вам генерировать новые гипотезы о данных.
  2. У вас есть несколько наборов данных генерируется из того же источника, и хотите, чтобы изучить возможные связи между этими наборами данных.
    1. Помещение нескольких наборов данных в тот же источник, то есть за два таблицы в той же книге, с тем чтобы Таблицы для подключения к этим набором данных через одно соединение.
    2. (Рис. 5) Подключение наборов данных с помощью логических присоединиться ключевых значений, убедившись, что измерения, которые являются одинаковыми для нескольких наборов данных будут выбраны. На рисунке 5, Есть пять основных значений для соединения: тип клеток, уровень стимулов концентрации, каскад или группа, стимул, и при условии идентификатор.
    3. Выполнить анализ, аналогичный раздел 1.1.

2. Презентация основе потребностей

  1. Вы знаете, отношения между данными, но вы хотите, чтобы иметь возможность быстро сгенерировать список визуализации для использования в презентации.
    1. Следуйте протоколом, изложенным в разделе 1.1, и аннотировать визуализации соответственно.
    2. Использование функции экспорта в Таблицы для получения изображений визуализации.
  2. Вы сформировали набор мощных визуализации в Tableau книгу и хотите поделиться этой книги.
    1. Сохранить книгу как книгу Таблицы упакованы и поделиться этим файлом.
    2. Коллеги без Tableau рабочего можете скачать Tableau чтения, чтобы открыть упакованные книги. Таблицы чтения позволяет вашим коллегам, чтобы взаимодействовать с визуализации, которые вы создали.

3. ПРЕДСТАВИТЕЛЬ РЕЗУЛЬТАТЫ

Рисунок 1
Рисунок 1. Скриншотиз Таблицы после импорта таблицы имени NFKBIA от demo.xls Excel файл. Измерений и мер полки были правильно заполнены категоричными и числовых данных, соответственно.

Рисунок 2
Рисунок 2. Вычисляемого поля окна вызывается для создания специальных вычисляемого поля для использования в таблицы. Список на нижнем левом поле помогает выявить возможные поля, и этот список на правой части содержит аббревиатуру функций, которые могут быть использованы в формуле. В этом примере мы хотим добавить значения для PFD4, PFD3 и PFD2 для получения окончательного значения, которое мы называем ПФО> 2

Рисунок 3
Рисунок 3. Визуализация стимул уровень концентрации по сравнению наблюдается концентрация цитокинов. Визуализация представлена ​​зависимость различных уровней концентрации стимул 3М-002 против наблюдается концентрация цитокина TNF-α. Цвета линий относятся к различным генотипы для однонуклеотидных полиморфизмов в гене NFKBIA лиц в нашей врожденной иммунной исследования.

Рисунок 4
Рисунок 4. Скриншот из двух столбцов матрицы визуализации. Мы создали две колонки матрицы для облегчения бок о бок сравнение ответов на два стимула, 3M-003 и ЛПС. Х-оси различных уровней концентрации двумя стимулами, а ось у участков значения вычисляемого поля, ПФО> 2.

Рисунок 5
Рисунок 5. Эти окна диалога Таблицы иллюстрируют, как подключить данные, записанные в разных таблицах. Подключение данных из различных таблиц может быть достигнуто путем объединения их с помощью логических присоединиться положений ключевых значений.

Визуализация и анализ инструментов
Функция Таблицы VIS-STAMP xmdvtool GGobi Звездный Gapminder Visulab InfoVis Инструментарий Geotime Вдохновлять
Параллельно координировать участков Да Да Да Да Да Нет Да Да Нет Нет
Матрицы Точечная диаграмма Да Нет Да Да Да Нет Да Нет Нет Нет
Размерная редукция Нет Нет Да Да Нет Нет Нет Нет Нет Нет
Временные размеры Да Да Нет Да Да Да Нет Да Да Нет
Geospatial размеры Да Да Нет Нет Да Да Нет Нет Да Нет
Text Mining Нет Нет Нет Нет Да Нет Нет Нет Нет Да
Прямое манипулирование данными Да Да Да Да Да Да Да Нет Да Нет
Фильтрация Да Да Да Да Да Да Да Нет Да Да
Расширения на другие платформы (например, R) Да Нет Да Да Нет Да Нет Да Нет Нет
Форматах CSV таблицы Да Да Да Да Нет Нет Да Да Да Нет
XML-форматов данных Да Нет Нет Да Да Нет Да Да Да Нет
Может дело с 10000 + строк Да Нет Нет Нет Да Нет Нет Нет Нет Да
Документация Да Да Да Да Да Да Да Да Да Да
Коммерческий продукт Да Нет Нет Нет Да Нет Нет Нет Да Да

Таблица 1. Список визуальных инструментов аналитики и некоторые их особенности.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Появление высокопроизводительных технологий в современных биомедицинских исследований привели к взрыву данные исследования, которое требует более эффективный способ анализа. Визуальный аналитики (VA) это наука о аналитического мышления способствует интерактивных визуальных интерфейсов (1). В. А. подход восстанавливает аналитического власть в руках человека аналитик, в отличие от традиционного подхода для выявления шаблонов с помощью компьютера. Визуальный аналитики был применен к исследованиям в различных областях, таких как оборонных исследований (1) и ураган тенденции (2). Пока, Есть только несколько примеров того, В. А. приложения в биологии (3). Мы показали в этом видео, что статья В. А. является подход, который можно добавить в арсенал биолога аналитических средств. Многие В. А. программного обеспечения доступны, начиная от тех, которые находятся в стадии разработки в научных лабораториях, чтобы те, которые являются коммерчески доступными. Для нашей работы по новорожденных врожденный иммунитет (4), мы выбрали Tableau из-за его пригодность для анализа электронных таблиц стилей данных доступна в лаборатории. Другие В. А. инструментов, некоторые из которых мы уже упоминали в нашем видео статьи, может быть более подходящим для других видов биологических данных. Мы перечислили функции и характеристики некоторых из наиболее популярных инструментов В. А. в таблице 1. Этот список не является исчерпывающим, потому что это выходит за рамки нашего исследования, но она должна быть хорошей отправной точкой для ученых, чтобы определить подходящий В. А. инструмент для своих конкретных наборов данных.

Существуют две основные моменты, касающиеся ВА, которое мы хотели бы обратить особое внимание. Один из них, В. А. подход задуман как исследование процесса, помогая аналитик быстро месте шаблонов, таких как общие тенденции и выбросов в данных. Основное внимание В. А. является предоставление мощной техникой визуализации для больших наборов данных. Это не альтернатива статистического анализа. На самом деле, большая часть В. А. инструменты очень ограничены в своей способности выполнить статистический анализ, хотя мы ожидаем, что это изменится в ближайшем будущем. Второй пункт мы хотим упомянуть, что предварительной обработки данных перед импортом набор данных, чтобы В. А. инструмент имеет решающее значение для успеха анализа. Имейте в виду, что данные, приведенные в человеческого понимания моды в электронных таблицах иногда отличаются от машиночитаемом формате. Данные предварительной обработки может быть трудоемким шагом, часто требует массивного преобразование данных, если исходный формат данных не подходит для В. А. инструмент. Мы настоятельно рекомендуем тщательное планирование ввода данных и кодировку, чтобы гибко и эффективно загружать их вниз по течению анализ программных средств, таких как те, которые доступны в ВА.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Нет конфликта интересов объявлены.

Acknowledgments

Мы хотели бы поблагодарить членов Ванкувере Институт визуальных Analytics (VIVA) для предоставления замечаний и советов для проекта. В частности, мы хотели бы поблагодарить Джона Укроп, Брайан Фишер, и Дэвид Дарвилл. Мы также хотели бы поблагодарить членов Кольман лаборатории за поддержку и полезные обсуждения. Эта работа была выполнена при частичной поддержке Национального института аллергии и инфекционных заболеваний, Национальный институт здравоохранения грант N01 AI50023; аллергена NCE гранты 07-A1A и 07-B2B, а также Майкл Смит фонда исследований в области здравоохранения. ТРК поддерживается частично Карьера премии в области биомедицинских наук в объявлении Burroughs Wellcome Фонда канадских институтов охраны здоровья подготовки научных кадров Грант в канадском детского здоровья Клиницист Ученый программы в партнерстве с больничных Детский фонд, семьи и ребенка-исследовательского института ( Британская Колумбия), Женщины и здоровье детей Научно-исследовательского института (Альберта), и Манитоба Института детского здоровья.

References

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Tags

Иммунологии выпуск 47 Visual аналитика проточной цитометрии Luminex Таблицы цитокин врожденный иммунитет одиночных нуклеотидных полиморфизма
Содействие Анализ иммунологических данных с визуальными Аналитические методы
Play Video
PDF DOI

Cite this Article

Shih, D. C., Ho, K. C., Melnick, K.More

Shih, D. C., Ho, K. C., Melnick, K. M., Rensink, R. A., Kollmann, T. R., Fortuno III, E. S. Facilitating the Analysis of Immunological Data with Visual Analytic Techniques. J. Vis. Exp. (47), e2397, doi:10.3791/2397 (2011).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter