Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: Графический интерфейс пользователя для упорядочения анализ высокого мерных данных цитометрии

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT, что на основе MATLAB графический пользовательский интерфейс (GUI), позволяет пользователям анализировать их потока данных цитометрии через часто используемые аналитические методы для высоких мерных данных, включая сокращение размерности через t СНЭ, целый ряд автоматизированных и ручных Кластеризация методы, карты и Роман высокой мерного потока участков.

Abstract

С появлением цитофлуориметрами потока, способный измерять все большее количество параметров ученые продолжают развивать больших панелей фенотипически исследовать характеристики их клеточных образцов. Однако эти технологические усовершенствования принести высокого мерного наборы данных, которые становятся все более трудно объективно проанализировать в рамках традиционных программ на основе руководства стробирования. Для того, чтобы лучше анализировать и представлять данные, ученые партнера с биоинформатики с опыт в анализе высокой мерных данных для разбора данных цитометрии их потока. Хотя эти методы показали весьма ценным в изучении проточной цитометрии, они еще должны быть включены в простой и легкий в использовании пакет для ученых, которые не имеют опыта программирования и вычислительная. Для удовлетворения этой потребности, мы разработали ExCYT, MATLAB-графический пользовательский интерфейс (GUI) что упрощает анализ данных цитометрии высокой мерного потока путем реализации обычно занятых аналитических методов для высоких мерных данных включая размерность сокращение t СНЭ, целый ряд автоматизированных и ручных методов кластеризации, карты и Роман высокой мерного потока участков. Кроме того ExCYT предоставляет традиционные стробирования варианты выбора населения интерес для дальнейшего t СНЭ и кластеризации, анализа, а также способность применять ворота непосредственно на t сне участков. Программное обеспечение предоставляет дополнительное преимущество работы с либо компенсацию или безвозмездное ФТС файлы. В том случае, если после получения компенсации не требуется, пользователь может выбрать предоставить программу каталога одного пятна и безупречный пример. Программа обнаруживает позитивные события во всех каналах и использует этот выбрать данные для более объективно расчета компенсации матрицы. В целом ExCYT обеспечивает всесторонний анализ конвейера потока данных цитометрии в виде файлов FCS и разрешить любой человек, независимо от вычислительных обучения, использования современных алгоритмических подходов в понимании их данных.

Introduction

Достижения в проточной цитометрии, а также появлением массового цитометрии позволило врачей и ученых, чтобы быстро выявлять и фенотипически характеризуют биологически и клинически интересные образцы с новыми уровнями резолюции, создавая большие высокий мерных наборов данных, которые информации богатые1,2,3. В то время как обычные методы для анализа потока данных цитометрии например ручной стробирования были более простым для экспериментов, где есть несколько маркеров и эти маркеры имеют визуально заметной населения, этот подход не может генерировать воспроизводимые результаты при анализе выше мерных наборов данных или с маркерами, Окрашивание спектра. Например в исследовании, многоучрежденческого, где внутри клеточных окрашивание (ICS) анализы выполняются для оценки воспроизводимости quantitating реакции антиген специфические Т-клеток, несмотря на хорошие межлабораторные точности, анализ, особенно Строб, представил значительный источник изменчивости4. Кроме того процесс вручную стробирования населения интересов, помимо того, что весьма субъективный интенсивно очень много времени и труда. Однако проблема анализа высокой мерных наборов данных на основе надежной, эффективной и своевременной является не один из новых наук исследования. Ген выражение исследования часто создают чрезвычайно высокой мерных наборов данных (часто порядка сотен генов) где ручной формы анализа будут просто неосуществим. Для того, чтобы решать анализ этих наборов данных, было много работы в разработке bioinformatic инструменты для разбора данных выражение гена5. Этих алгоритмических подходов просто были недавно приняты в анализе данных цитометрии увеличилось количество параметров и оказались очень полезными при анализе этих высоких мерных наборов данных6,7.

Несмотря на создание и применение различных алгоритмов и программных пакетов, которые позволяют ученым применять эти высокий мерного bioinformatic подходы к их данным цитометрии потока эти аналитические методы по-прежнему во многом неиспользуемых. Хотя может существовать целый ряд факторов, которые ограничивают широкое внедрение этих подходов к цитометрии данных8, основным препятствием которых мы подозреваем в использование этих подходов ученых, является отсутствие вычислительные знания. В самом деле многие из этих пакетов программного обеспечения (т.е., flowCore, flowMeans и OpenCyto) записываются в языках программирования, например R по-прежнему требующих основной знания программирования. Пакеты программного обеспечения, таких как FlowJo нашли пользу среди ученых благодаря простоте использования и природа «plug-n-play», а также совместимость с операционной системой компьютера. Для того, чтобы обеспечить разнообразие принятых и ценных аналитических методов для незнакомых программирование ученого, мы разработали ExCYT, графический пользовательский интерфейс (GUI), который может быть легко установлен на PC/Mac, который тянет многие из новейших методов включая снижение размерности для интуитивно визуализации, разнообразные методы кластеризации, цитируется в литературе, наряду с новизну для изучения вывода этих кластеризации алгоритмы с карты и Роман высокой мерного потока/прямоугольные.

ExCYT — это графический пользовательский интерфейс, построенный в MATLAB и поэтому можно либо запустить в MATLAB непосредственно или установщик предоставляется, который может использоваться для установки программного обеспечения на любой PC/Mac. Программное обеспечение доступно на https://github.com/sidhomj/ExCYT. Мы представляем подробный протокол о том, как импортировать данные, предварительно обработать его, провести сокращение размерности t СНЭ, кластер данных, сортировка и фильтр кластеров на основе предпочтений пользователя и отображения информации о кластерах интерес через карты и Роман высокий мерного потока/прямоугольные ()Рисунок 1). Топоры в t сне участков являются произвольными и в произвольных единицах и как таковые не всегда показано на рисунках для простоты пользовательский интерфейс. Раскраска точек данных в «T СНЭ карты» — от синего до желтого, основанный на сигнал указанного маркера. В кластеризации решения, цвет точки данных на основе произвольных номер кластера. Все части рабочего процесса может осуществляться в одной панели GUI ()Рисунок 2 & таблицы 1). Наконец мы продемонстрируем использование ExCYT ранее опубликованных данных, изучение иммунного пейзаж ренальной карциномы клетки в литературе, также проанализированы с аналогичными методами. Образец набора данных, который мы использовали для создания фигур в этой рукописи вместе с протоколом ниже можно найти на https://premium.cytobank.org/cytobank/projects/875, после регистрации учетной записи.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. сбор и подготовка данных цитометрии

  1. Поместите все одного пятна в папке сами и метка, имя канала (по Флюорофор, не маркер).

2. данных импорт и предварительной обработки

  1. Чтобы приостановить или сохранить на протяжении всего этого анализа трубопровода, используйте кнопку Сохранить рабочую область в нижнем левом углу программы для сохранения рабочей области как '. МАТ ' файл, который впоследствии может быть загружен через кнопку Рабочей нагрузки . Не запускайте одновременно более одного экземпляра программы. Таким образом при загрузке новой рабочей области, убедитесь, что проверить, что нет никакой другой экземпляр ExCYT работает.
  2. Чтобы начать анализ трубопровода, сначала выберите тип цитометрии (поток цитометрии или массы цитометрии – CYTOF), под Параметры выбора файла выберите количество событий для выборки из файла (для этого примера используйте 2000). После успешного импорта данных диалоговое окно хлопнет вверх информирование пользователя о том, что данные успешно импортированы.
  3. Нажмите кнопку Auto-компенсации для проведения Факультативный auto компенсация шаг, как сделано Bagwell и Адамс9. Выберите каталог, содержащий одного пятна. Выберите безупречный образец в рамках диалога интерфейса пользователя.
    1. Место вперед/сторона точечной ворота на любой из образцов в этот каталог, который будет использоваться для выбора событий для расчета компенсации матрицы. Рекомендуется использовать безупречный образец для этой цели. На данный момент алгоритм реализован для последовательного пороги 99ой персентили неокрашенных образца, чтобы определить положительные события в каждом из одного пятна для расчета компенсации матрицы. Когда это закончится, появится диалоговое окно будет информировать пользователя о выполнения компенсации.
  4. Затем нажмите Ворота населения и выберите популяции клеток интереса, как Конвенция в потоке cytometry анализ. При выборе популяция клеток, введите количество процент вниз по течению анализ событий (в данном 10 000 событий).
  5. Далее, выберите число каналов использоваться для анализа в listbox в крайнем правом поле предварительной обработки (используйте специфические каналы, показано в примере).

3. t СНЭ анализ

  1. Нажмите на кнопку T СНЭ чтобы начать Пуск программа для вычисления набора данных снижение размерности для визуализации в окне ниже кнопку t сне. Чтобы сохранить изображение t СНЭ, нажмите Сохранить изображение TSNE. На машине с 8 CPU @ 3,4 ГГц и 8 GM оперативной памяти, этот шаг должен принять около 2 минут за 10 000 событий, 10 минут для 50000 событий и 20 минут для 100 000 событий.
  2. Для создания 't СНЭ heatmap', как видно в нескольких CYTOF публикации10,11, выберите вариант во всплывающем меню Маркер-специфических т НСЗ (Используйте конкретные маркеры CD64 или CD3, как показано в примере). Фигура будет всплывающее показаны heatmap представление t СНЭ заговор, который может быть сохранен для поколения рисунок.
  3. Выберите области интересов в t сне участков пользователем для дальнейшего течению анализа с использованием T СНЭ ворота кнопку.

4. кластерный анализ

  1. Чтобы начать, кластеризации, анализа, выберите вариант в Кластеризации метод listbox (в этом примере нас DBSCAN с коэффициентом расстояние 5 в диалоге поле справа от элемента управления listbox). Нажмите на кнопку кластера .
  2. Используйте один из следующих параметров для автоматической кластеризации алгоритмов в панели «Параметры автоматической кластеризации»:
    1. Жесткий KMEANS (на т СНЭ): применять k средства кластеризации данных снижение 2-мерной t СНЭ и требует количество кластеров, чтобы оказываться алгоритм12.
    2. Жесткий KMEANS (по данным HD): применять k средства кластеризации к исходным данным высоким мерного которое было дано на t СНЭ алгоритм. Еще раз количество кластеров должна быть предоставлена для алгоритма.
    3. DBSCAN: Применять метод кластеризации кластеризации, называется на основе плотности пространственных кластеризации приложений с шумом13 кластеров данных снижение 2-мерной t СНЭ и требует-мерного Расстояние фактор, который определяет общий размер кластеры. Этот тип алгоритм кластеризации хорошо подходит для кластера t СНЭ сокращения, как она способна кластер не чугун с шаровидным, которые часто присутствуют в сокращение t СНЭ представительства. Кроме того с тем, что она работает на 2-мерных данных, это один из алгоритмов, быстрее кластеризации.
    4. Иерархической кластеризации: Применяйте метод обычных иерархической кластеризации для высоких мерных данных, где вычисляется обратная матрица весь евклидового расстояния между всеми событиями до предоставления алгоритм Расстояние фактор, который задает размер кластера.
    5. Сетевой график- Основан: Применяйте метод кластеризации, который совсем недавно был введен в анализе данных цитометрии потока, когда есть редкие субпопуляций, которые пользователь хочет обнаружить11,14. Этот метод полагается на первый создание графа, который определяет связь между всеми событиями в данных. Этот шаг состоит из предоставления начальный параметр для создания графа, который является номером k ближайших соседей. Обычно этот параметр регулирует размер кластеров. На данный момент еще один диалог всплывает окно, задавая пользователю использовать один из 5 алгоритмов кластеризации, который применяется к графу. К ним относятся 3 варианта для максимальной модульности граф, метод Danon и спектральные кластеризации алгоритм14,,1516,17,18. Если один хочет обычно быстрее кластерного решения, мы рекомендуем спектральных кластеризации или быстро жадные максимальной модульности. В то время как методы максимизации модульность наряду с методом Danon определить оптимальное количество кластеров, спектральные кластеризация требует количество кластеров необходимо уделять программе.
    6. Самостоятельно организовал карта: Используют искусственные нейронные сети для кластера высокой мерных данных.
    7. ГИМ – максимизация ожидания: создать модель Гаусса смеси методом максимизации ожидания (EM) для кластера высокой мерных данных. 19 этот тип метода кластеризации также требует от пользователя ввода количество кластеров.
    8. Вариационные Байесовский вывод для GMM: создать модель Гаусса смесь, но в отличие от EM, он может автоматически определить количество смеси компонентов k.20 в то время как программа требует количество кластеров следует уделить (больше, чем Ожидаемое количество кластеров), алгоритм будет определить оптимальное число на свой собственный.
  3. Для изучения конкретной области участка t СНЭ, нажмите кнопку Выберите кластер вручную рисовать набор определяемых пользователем групп. Следует отметить кластеры не разделяют членов (т.е., которую каждое событие может принадлежать только 1 кластера).

5. блок фильтрации

  1. Набора(ов) кластеров выявленных либо вручную или через один из автоматических методов, описанных выше можно отфильтровать через следующим образом.
    1. Чтобы отсортировать кластеры (в панели Фильтр кластера ) по любой из маркеров, измеряется в эксперименте, выберите параметр из всплывающего меню Сортировка . Чтобы задать ли порядок по возрастанию или по убыванию, нажмите кнопку справа от всплывающего меню Сортировка По возрастанию/по убыванию . Это обновит список кластеров в listbox «Кластеры (фильтрации)» и повторно заказать их в порядке убывания средний кластера выражения этого маркера. Процент, отмечены в списке «Кластеры (фильтрации)» обозначает процент населения, что представляет собой этот кластер.
    2. Чтобы задать минимальное пороговое значение для данного кластера через определенный канал, выберите параметр во всплывающем меню порог (в этом примере нас маркер CD65 и установить порог 0,75). Либо введите значение в поле Числовой под диаграммой или использовать слайд бар установить порог. После того, как порог установлен, нажмите кнопку Добавить выше порога или Добавить ниже порогового значения для указания направления порога. После того, как этот порог, будут перечислены в поле пороговые значения рядом с панелью «Фильтр кластера», где маркер, порогового значения и направления будут перечислены так, что пользователь осознает какие пороговые значения применяются в настоящее время. Наконец t СНЭ сюжет будет обновлять путем размытия, кластеры, которые не отвечают требованиям фильтрации и listbox «Кластеры (фильтрации)» будет обновлять для отображения кластеров, которые отвечают требованиям фильтрации.
    3. Чтобы задать минимальный порог для частоты кластера, введите численного отсчета в Кластер порог частоты (%) окно в панели фильтр кластера (в этом примере использования 1%).

6. кластер, анализ и визуализация

  1. Чтобы выбрать кластеры для дальнейшего анализа и визуализации, в кластерах (фильтрации) listbox выберите кластеров и нажмите кнопку выбрать меню , чтобы переместить их в Кластер анализировать listbox.
  2. Для создания диаграммы кластеров, выберите кластеры интерес в listbox Анализировать кластера и нажмите кнопку HeatMap кластеров . Когда эта кнопка нажата, фигура будет всплывающее содержащая тепловую карту вместе с dendrograms на оси кластера и параметров. Дендрограмма на вертикальной оси будет группировать кластеры, которые тесно связаны во время дендрограмма на горизонтальной оси будут группы маркеров, которые совместно связаны. Чтобы сохранить heatmap, нажмите файл | Экспортировать установки | Экспорт.
  3. Для создания «Высокой размерной блочной» или «Высоких размеров потока участок», выберите кластеры интерес в списке Кластер анализа и нажмите кнопку Высокой размерной блочной или кнопку Высоких размеров потока участок . Эти участки могут использоваться для визуально оценить распределение каналов различных кластеров с учетом во всех измерениях.
  4. Чтобы показать кластеров в традиционной 2D потока участков, выберите преобразование (линейная, log10, arcsinh) и канал в Обычных потока участок панели и нажмите обычного потока участок.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Для того чтобы испытать удобство использования ExCYT, мы проанализировали куратор набор данных, публикуемых Chevrier et al. , под названием «иммунной Атлас из четких почечная карцинома» где группа провела анализ CyTOF с обширной иммунной группа на опухоль проб, взятых из 73 11больных. Два отдельных панелей, миелоидной и лимфоидных группа, были использованы для фенотипически характеризуют микроокружения опухоли. Целью нашего исследования было охарактеризовать результаты их t СНЭ и кластер анализ, показаны, что ExCYT может использоваться для прийти к тем же выводам, а также показать дополнительные методы визуализации и кластер анализа.

В оригинальном манускрипте группа описал 22 Т-клеток кластеры, выявленные группой лимфоидных и 17 кластеры клеток миелоидного группой. В рисунке 3 и Рисунок 4 публикации группа показывает диаграммы кластеров, t сне участков с цветом кластерных решений и карты t НСЗ в показ A, B и C. Для того, чтобы выполнить анализ, мы получили вручную закрытых данных от Cytobank и пробы 2000 события из каждого файла или взял весь файл, если он был меньше, чем 2000 мероприятий, после анализа трубопровода показано в оригинальном манускрипте. На данный момент мы пробы в общей сложности 100 000 событий через наш пост стробирования подвыборки параметр, провела анализ t СНЭ и использовали различные методы кластеризации для просмотра данных различными способами.

Во-первых мы рассмотрели миелоидного группа, следуя же анализа трубопровода как оригинальной рукописи, завершение анализа t СНЭ и создавая диаграммы различных маркеров (рис. 3A). В то время как оригинальный манускрипт нормированный карты t-SNE на 99ую персентиль каждого маркера, ExCYT не делает этот тип нормализации для своей карты. Однако подобные дистрибутивов маркер совместного выражения были замечены как описано в оригинальном манускрипте. Мы затем применяется на основе сетевой граф метод кластеризации данных, создавая граф с 100 k ближайших соседей и кластеризации граф через оптимизация модульность графа с помощью реализации быстро-жадный в ExCYT, где мы нашли 19 суб популяции клеток (рис. 3B). При сравнении heatmap этих кластеров, созданных ExCYT с heatmap опубликованы в оригинальном манускрипте, мы отметили, что мы смогли определить похожие кластеры миелоидных клеток (рис. 3 c). Следует отметить, оригинальной рукописи выявлены и сравнении двух подгрупп населения миелоидных клеток, которые мы определили в нашем анализе определяется HLA-DRintCD68intCD64intCD36+CD11b+ (кластер 13) и HLA-DR+ CD4+CD68+CD64+CD36 CD11b (Группа 18). Визуализация участок высокой мерном поле этих двух групп населения выявлены статистически значимые различия (Манна-Уитни) в шести упомянутых маркеры (рис. 1 d).

Далее мы проанализировали лимфоидных панель с более традиционными и быстрее иерархической кластеризации подход. Этот подход принес аналогичные маркер дистрибутивы через t СНЭ диаграммы (рис. 4A). Кроме того кластеризации данных через иерархической кластеризации (рис. 4B), продемонстрировал похожие кластеры лимфоидных клеток (рис. 4 c). Записки, мы также определили уникальный регулирования Т-клеток населения из оригинала манускрипта, определяется как CD4+CD25+Foxp3+CTLA-4+CD127 (кластер 17) через наш участок высокой мерного потока (рис. 4 d).

Наконец мы хотели бы использовать метод в ExCYT быстро и количественно оценить сопредседатель ассоциации между маркерами. Мы начали с помощью алгоритма кластеризации жесткий k означает сложить 5000 кластеров на двумерной t СНЭ данных (Рисунок 4E). Затем мы использовали средний выражение всех маркеров всех этих кластеров для создания heatmap от этих кластеров (Рисунок 4F). Поскольку эти диаграммы кластера строк, а также столбцы, которые являются аналогичными, этот метод абстрагирования данных путем применения тонкой сеткой кластеров и затем создавая heatmap позволяет нам подобрать сопредседатель ассоциации легко, как сопредседатель ассоциации Тим-3, ПД-1, CD38, и 4-1BB.

Figure 1
Рисунок 1: ExCYT конвейера и особенности. (A) ExCYT начинается, импорт необработанных данных FCS, применяя факультативного компенсации, стробирование и случайных подвыборка до течению анализа. Это гарантирует, что все события анализируются актуальны для анализируемого эксперимент. t СНЭ размерность сокращение затем выполняется визуализировать все события и t СНЭ карты могут быть сгенерированы для визуализации фенотипические дистрибутивов. Наконец различных алгоритмов кластеризации может применяться на t СНЭ преобразования или высокой мерного необработанных данных. (B) Роман сортировки и Бинаризация функции позволяют пользователям быстро сортировать через возможно сотни кластеров, чтобы найти те интерес. (C) диаграммы кластеров могут быть созданы для изучения, как несколько кластеров сравнить друг с другом и какие маркеры связать совместно. (D) Роман поток высокой мерной в коробке участки могут быть созданы как форма обратно стробирования кластеров на исходных данных оценивая высокой мерной природы данных. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 2
Рисунок 2: ExCYT графический интерфейс пользователя: ExCYT, графический интерфейс пользователя позволяет рационализировать работу потока работы от левого справа от панели как пользователь импортирует их данных, проводит снижение размерности t СНЭ, кластеризации и окончательный кластерного анализа и визуализации. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 3
Рисунок 3: Резюме миелоидного подгрупп населения от Chevrier et al. (A) маркер карты t СНЭ миелоидного панель (B) t СНЭ участка миелоидного панели цвета кодированная кластеризации алгоритмом сети-граф (C) Heatmap кластеров, определены кластеризации решение миелоидного панели (D) сравнительный высокой размерные блочная диаграмма сравнения, контрастные миелоидного субпопуляций (кластеры 13 и 18) ссылка в оригинальном манускрипте пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Figure 4
Рисунок 4: Резюме лимфоидных подгрупп населения от Chevrier et al. (A) маркера карты t СНЭ лимфоидных панель (B) t СНЭ участка лимфоидных панели цвета закодированы иерархический алгоритм кластеризации (C) Heatmap кластеры, выявленные кластеризации решение на лимфоидных группа (D) высокой размерной потока участок населения определены нормативные Т-клеток (кластер 17) в оригинальной рукописи (E) решения кластеризации 5000 кластера жесткий k средства анализа на t СНЭ данных (F) Heatmap кластеры, выявленные k означает кластерного решения на лимфоидных Группа показаны маркера сопредседатель ассоциации. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

LOL Описание Имя (в GUI)
1 Выберите тип цитометрии NA
2 Случайные подвыборка необработанных данных NA
3 Выберите файлы для анализа Выберите файл(ы)
4 Авто компенсация необработанных данных, основанных на каталоге одного пятна, для программного обеспечения Авто компенсация
5 Строб для выбора событий для t СНЭ и кластеризации анализа Ворота населения
6 Случайные подвыборка из закрытого данных (абсолютное число) NA
7 Случайные подвыборка из закрытого данных (% условного населения) NA
8 Выберите каналы для анализа NA
9 Запустите t СНЭ снижение размерности t НСЗ
10 t сне окно NA
11 Сохранение рабочей области Сохранение рабочей области
12 Загрузить рабочую область Загрузить рабочую область
13 Создайте heatmap t-SNE на выберите маркер NA
14 Ворота t СНЭ заново делать t СНЭ анализ выберите населения Ворота t НСЗ
15 Сохранить как изображение t сне окно Сохранить изображение с TSNE
16 Выберите алгоритм кластеризации Метод кластеризации
17 Введите параметр кластеризации для данного алгоритма NA
18 Кластерный анализ Кластер
19 Нарисуйте кластерами вручную Выберите кластер вручную
20 Очистить все кластеры, чтобы повторить кластерного анализа Очистить кластеров
21 Показывать кластеры в нынешних условиях фильтра Кластеры (фильтрации)
22 Удалить выбор кластеры из кластера анализировать listbox Удаление <--
23 Добавление кластера для кластера анализировать listbox --> Выберите
24 Создание обычных heatmap всех событий в анализ Тепловая карта событий
25 Сортировка групп, выберите маркер Сортировка
26 Установить порог выберите маркер Порог
27 Создание обычных heatmap выберите кластеров из кластера анализировать listbox Тепловая карта кластеров
28 Флип порядок сортировки По возрастанию/по убыванию
29 Очистить все пороги Очистить все пороги
30 Установка частоты порог для кластеров Порог частоты кластера (%)
31 Список текущих порогов на listbox «Кластеры (фильтрации)» Пороговые значения
32 Коробка высокая мерного участка Коробка высокая мерного участка
33 Участок высокого размеров потока Участок высокого размеров потока
34 Параметр горизонтальной оси для обычного потока участок NA
35 Параметр вертикальной оси для обычного потока участок NA
36 Преобразование данных для обычного потока участок на горизонтальной оси NA
37 Преобразование данных для обычного потока участок на вертикальной оси NA
38 Создание обычного потока участок Обычные потока участок
39 Показывать кластеры для анализа NA

Таблица 1: Обзор всех функций в ExCYT GUI

Имя пакета программного обеспечения ExCYT CYT FCS Экспресс flowCore openCyto FlowMeans
Тип программы MATLAB MATLAB Автономное приложение R R R
Стоимость для пользователя Бесплатно Бесплатно $1,000 Бесплатно Бесплатно Бесплатно
Графический интерфейс пользователя Да Да Да Нет Нет Нет
Методы снижения размерности t НСЗ t СНЭ, PCA t СНЭ, PCA, лопата нет нет нет
Алгоритмы кластеризации K-средства
DBSCAN
Иерархическая кластеризация
Самоорганизации карта
Множественные сети граф на основе методов
GMM - EM
GMM - вариационных Байесовский вывод
K-средства
GMM - EM
Один сетевой график на основе метода (Phenograph)
K-средства нет Автоматизация процесса ручной стробирования K-средства
Возможность сортировки/фильтр кластеров Да Нет Нет Нет Нет Нет
Участки высокой размерной потока Да Нет Нет Нет Нет Нет

Таблица 2: Обзор решений при помощи программного обеспечения потока Cytometry анализ

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Здесь мы представляем ExCYT, Роман графический пользовательский интерфейс, работает на основе MATLAB алгоритмы для упрощения анализа данных высокой мерного цитометрии, позволяющие лицам без фона в программировании для реализации последней в высоких мерных данных алгоритмы анализа. Наличие этого программного обеспечения для более широкого научного сообщества позволит ученым для изучения их потока данных цитометрии в интуитивно понятный и простой рабочий процесс. Через проведение t СНЭ размерность сокращения, применяя метод кластеризации, будучи в состоянии параметры сортировки или фильтр через эти кластеры быстро, и сделать гибкие, настраиваемые диаграммы и высокой мерного потока/прямоугольные, ученые смогут не только понять уникально определенные субпопуляции в их образцы, но будет иметь возможность создавать зрительные образы, которые интуитивно понятный и легко понять их коллег.

Хотя эта программа является гибкость в обработке различных типов (обычных проточной цитометрии против массового цитометрии) данных, существует несколько соображений для оптимальной полезности программы. Первый из них касается качества данных, в частности цитометрии потока данных. Надлежащая компенсация и разрешение перекрывающиеся спектры выбросов имеет первостепенное значение. Слабо компенсируется данных непреднамеренно может привести к ложным сопредседатель ассоциации маркеров и формирования кластеров, которые не имеют истинной биологическое значение. Таким образом рекомендуется, что качество звука, прежде чем продолжить с t СНЭ и далее вниз по течению анализ входных данных. Кроме того использование автоматической компенсации алгоритм реализован в ExCYT требует ясно одного пятна для всех каналов для того, чтобы точно рассчитать параметры компенсации.

Еще одним важным соображением для использования ExCYT, когда объединение нескольких файлов FCS в один анализ (как показано в этой рукописи), они должны быть сопоставимыми во всех каналах. Во-первых это означает, что панель же должен использоваться во всех образцов и что нет никакого дрейфа между выборок по всем каналам. Например если один были читать две пробы на отдельные дни и окрашенных CD8 в FITC на дней но напряжения цитометр был установлен по-разному на один день в результате слегка смещенные CD8 населения, одно может генерировать ложных кластеров в нижнем течении анализ , как этот переход был создан как функция изменения инструмент и не из-за биологическое значение. В то время как будущие версии ExCYT могут быть способны нормализовать образцов их одного пятна, на данный момент, тщательного рассмотрения должны быть сделаны что ФТС файлы можно сравнить друг с другом перед импортом их в ExCYT.

Наконец процесс кластеризации является не один, что абсолютная/грузовик. Различные алгоритмы кластеризации и параметры можно создавать различные кластерных решений. Подходит ли решение алгоритма является для пользователя, чтобы определить, обобщающий их понимание биологии с кластерного решения. Например, когда понимание иммунной среды опухолей, один может быть заинтересован в Макроскопические кластеры (т.е., T клетки против B клетки против миелоидных клеток) в то время как другой может быть заинтересован в субпопуляций Макроскопические кластеры. Разрешение кластеров определяется пользователем, и таким образом, нет единого решения кластеризации «правильно». Это одно из главных преимуществ использования высоких размеров потока участки в ExCYT. Способность визуализировать распространение данного кластера на всех каналах может помочь пользователю определить, ли они сосредоточены в не только биологически соответствующих путь, но таким образом, что имеет отношение к научным вопрос в эксперименте. Хотя наша цель предоставить множество методов, используемых в литературе для кластера высокой мерного потока цитометрии данных, обеспечивая дополнительные методы кластеризации, мы рекомендуем использовать такие методы, как k средства и DBSCAN быстро исследовать данные через итерации на номер кластера и размер и двигаться в направлении сети граф и Гаусса смешанная модель подходы для более надежной, но больше времени подходов.

Учитывая эти соображения, ExCYT до сих пор является очень гибким и ценным инструментом для изучения данных высокой размерной цитометрии и предлагает уникальные/дифференциации функций, чем другие доступные пакеты для проведения подобного анализа (таблица 2) . Во-первых ExCYT отличает себя над большинство потока cytometry анализ подходов использования снижения размерности и кластеризации алгоритмы, его способность использовать без каких-либо знаний программирования и сценариев. Кроме того путем объединения многих алгоритмов кластеризации, цитируется по всей литературы, мы считаем, что мы предоставляем самые варианты для кластеризации данных. Наконец Наша уникальная особенность кластера фильтрации и сортировки наряду с дисплея через роман высокой размерной потока участков, позволяет пользователям исследовать характеристики их кластеров, быстро и эффективно, делая процесс «открытие» редких субпопуляций, простой и эффективной.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторы не имеют ничего сообщать.

Acknowledgments

Авторы имеют без подтверждений.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

Ретракция выпуск 143 поток цитометрии высокой-размерного анализа t СНЭ кластеризация тепловые карты снижение размерности
ExCYT: Графический интерфейс пользователя для упорядочения анализ высокого мерных данных цитометрии
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter