Waiting
Login-Verarbeitung ...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

Выполнение интеллектуального анализа данных и интегративный анализ биомаркеров в раке молочной железы с использованием нескольких публично доступных баз данных

Published: May 17, 2019 doi: 10.3791/59238

Summary

Здесь мы представляем протокол для изучения биомаркеров и прогнозирования выживаемости рака молочной железы на основе комплексного анализа Объединенных клинических наборов данных, полученных из различных общедоступных баз данных, используя стратегию выражения, корреляции и анализ выживаемости шаг за шагом.

Abstract

В последние годы, новые базы данных были разработаны, чтобы снизить барьеры для приближения сложных наборов данных геномных рака, тем самым, облегчая следователям анализировать и интерпретировать гены, образцы и клинические данные между различными типами рака. Здесь мы описываем практическую процедуру операции, принимая ID1 (ингибитор ДНК связывания белков 1) в качестве примера, чтобы охарактеризовать экспрессию моделей биомаркеров и выживания предсказателей рака молочной железы на основе Объединенных клинических наборов данных, полученных из онлайн доступных баз данных, в том числе ONCOMINE, bcGenExMiner v 4.0 (рак молочной железы гена-экспрессия Шахтера v 4.0), GOBO (гена на основе экспрессии исход рака молочной железы онлайн), HPA (человеческий протеин Атлас), и Каплан-Мейер плоттер. Анализ начался с запроса шаблона экспрессии гена интереса (например, ID1) в раковых образцах против нормальных образцов. Затем был выполнен корреляционный анализ между ID1 и клиникопатологическими характеристиками при раке молочной железы. Далее, профили экспрессии ID1 были стратифицированные по разным подгруппам. Наконец, была проанализирована связь между выражением ID1 и исходом на выживание. Операция упрощает концепцию для интеграции многомерных типов данных на генном уровне из различных баз данных и тестовых гипотез относительно рецидивов и геномной связи в случаях изменения генов при раке молочной железы. Этот метод может повысить достоверность и представительность выводов, тем самым, представить информативную перспективу на ген интересов.

Introduction

Рак молочной железы является неоднородным заболеванием с разнообразными прогнозом и стратегиями лечения в различных молекулярных подтипах, в которых патогенез и развитие, вероятно, связаны с разрозненными молекулярными механизмами1,2 , 3. Однако, определение терапевтической цели обычно занимает годы, или даже десятилетия, от первоначального открытия в фундаментальные исследования для клинического использования4. Широкое применение генома технологии высокой пропускной способности секвенирования для генома рака значительно продвинуло процесс поиска ценных биомаркеров или терапевтических целей 5.

Подавляющее количество генетических данных о раке, генерируемых в результате крупномасштабных систем геномики рака, таких как ICGC (Международный консорциум генома рака) и TCGA (Атлас генома рака), представляет собой большую проблему для исследователей, выполняющих данные Разведка, интеграция и аналитика, особенно для пользователей, которым не хватает интенсивной подготовки по информатике и вычислениям6, 7,8,9,10. В последние годы, новые базы данных, (например, ONCOMINE, bcGenExMiner v 4.0, и Каплан-Мейер плоттер и т.д.) были разработаны и разработаны, чтобы понизить планку для приближения сложных наборов данных геномных рака, тем самым, облегчая следователям анализировать и интерпретировать гены, образцы и клинические данные по различным видам рака11. Цель этого протокола заключается в описании исследовательской стратегии, которая интегрируется с множественными уровнями информации о гене из серии баз данных открытого доступа, которые были широко признаны большим числом исследователей, для выявления потенциальных биомаркеров и прогностических факторов рака молочной железы.

База данных ONCOMINE представляет собой веб-платформу для майнинга данных с информацией о микромассиве рака и предназначена для облегчения открытия новых биомаркеров и терапевтических целей11. В настоящее время существует более 48 000 000 измерений экспрессии генов 65 из наборов данных экспрессии генов в этой базе данных 11, 12. BcGenExMiner v 4.0 (бесплатный инструмент для некоммерческих учреждений), также называемый рак молочной железы гена-выражение Шахтер, является удобной веб-приложение, включающее ДНК микромассивов результаты 3 414 восстановленные больных раком молочной железы и 1 209 опытных уничижительное событие13. Он предназначен для улучшения производительности прогностического анализа генов с R статистического программного обеспечения и пакетов.

GOBO является многофункциональным удобным для пользователя онлайн-инструментом с информацией о микромассивах (например, U133A) из набора клеточных линий рака молочной железы 51 образца и набором данных опухоли молочной железы 1881 образца, который позволяет широкий спектр анализов14. Есть множество приложений, доступных в базе данных GOBO, которые включают в себя быстрый анализ профилей экспрессии генов в различных молекулярных подтипов опухолей молочной железы и клеточных линий, скрининг для совыраженных генов для создания потенциальных метагенес, и Корреляционный анализ между результатами и уровнями экспрессии генов одиночных генов, наборов генов, или подписей генов в наборе данных рака молочной железы15.

Атлас человеческого белка – это программа открытого доступа, предназначенная ученым для изучения протеома человека, которая уже внесла свой вклад в большое количество публикаций в области биологии и болезней человека. Человеческий протеин Атлас признан Европейским основным ресурсом для науки о жизни сообщества16,17.

Плоттер Каплан Мейер это онлайн инструмент интеграции экспрессии генов и клинических данных одновременно, что позволяет оценить прогностический эффект 54 675 генов на основе 10 461 образцов рака, которые включают 1 065 желудка, 2 437 легких, 1 816 яичников и 5 143 больных раком молочной железы со средним последующей 33/49/40/69 месяцев18. Информация о экспрессии генов, безрецидивной выживания (RFS) и общей выживаемости (OS) являются загружаемые из этой базы данных19,20.

Здесь мы описываем практическую процедуру работы с использованием нескольких общедоступных баз данных для сравнения, анализа и визуализации закономерностей изменений в выражении гена заинтересованности в различных исследованиях рака с целью резюмирование Профили выражения, прогностические значения и потенциальные биологические функции при раке молочной железы. Например, недавние исследования показали, что Онкогенные свойства ИДЕНТИФИКАЦИОННЫХ белков в опухолях и были связаны со злокачественными особенностями, включая клеточную трансформацию, увековечивание, усиленное распространение и метастазирование21, 22,23. Тем не менее, каждый член семьи ID играет определенную роль в различных типах твердых опухолей, и их роль в раке молочной железы остается неясным24. В предыдущих исследованиях, исследованных с помощью этого метода, мы обнаружили, что ID1 был значимым прогностическим показателем в раке молочной железы25. Таким образом, протокол будет принимать ID1 в качестве примера для внедрения методов интеллектуального анализа данных.

Анализ начинается с запроса шаблона экспрессии гена интереса к раковым образцам против нормальных образцов в ONCOMINE. Затем, выражение корреляции генов, представляющих интерес в раке молочной железы был выполнен с помощью БК-GenExMiner v 4.0, GOBO, и ONCOMINE. Затем профили экспрессии ID1 были стратифицированные по разным подгруппам с использованием вышеуказанных трех баз данных. Наконец, связь между выражением ID1 и выживание была проанализирована с помощью БК-GenExMiner v 4.0, человеческий протеиновый Атлас, и Каплан-Мейер плоттер. Операция была показана как блок-схема на рисунке 1.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. анализ шаблона выражения

  1. Перейдите на веб-интерфейс ONCOMINE26.
  2. Получить относительные уровни экспрессии гена id1 в различных типах злокачественных новообразований, набрав id1 в окне поиска.
  3. Выберите тип анализа из первичного меню фильтров . Затем выберите рак против нормального анализа, рак молочной железы против нормального анализа.
  4. Выберите краткий обзор гена из другого меню представлений . Установите порог P-значения на уровне 0,01. Скачать цифры.
    Примечание: порог смены раза 2, как описано в предыдущем исследовании27.

2. анализ корреляции экспрессии

  1. Перейти к БК-GenExMiner v 4.0 веб-интерфейс28.
  2. Выберите корреляцию из меню анализа , нажмите на исчерпывающую кнопку. Введите id1 в поле поиска. Нажмите кнопку " Отправить " и кнопку " начать анализ ".
    Примечание: Настройка по умолчанию Показать корреляционный анализ всех пациентов, которые могут быть более точными в различных подтипов рака молочной железы, нажав на фильтр подтипа молекулы .

3. Анализ подгрупп

  1. Анализ подгрупп в БК-Генэксмайнер v 4.0
    1. Перейти к БК-GenExMiner v 4.0 веб-интерфейс28.
    2. Выберите выражение из меню анализа , нажмите на исчерпывающую кнопку. Введите id1 в окне поиска и нажмите кнопку отправки и кнопку запуска анализа .
    3. Нажмите на Nodal статус (в) и скарфф Блум & Ричардсон Оценка состояния (SBR) эскизы для просмотра полных изображений. В изображениях SBR нажмите на кнопку ниже, чтобы визуализировать P-значения фигур. Скачать цифры.
  2. Анализ подгрупп в экспрессии гена основе исход рака молочной железы онлайн (GOBO)
    1. Перейти на веб-интерфейс GOBO14.
    2. Тип гена символ интереса id1 на экране загрузить ген набор.
    3. Установите диапазон поиска для определения гена/идентификатора зонда к символу гена. Установите все в выборе опухоли. Выберите состояние узла и степень расслоенная в многомерных параметров. Другие элементы остаются по умолчанию. Отправьте запрос и загрузите данные.

4. анализ выживаемости

  1. Анализ выживаемости в БК-Генэксмайнер v 4.0
    1. Перейти к БК-GenExMiner v 4.0 веб-интерфейс28.
    2. Выберите прогностическое из меню анализа , нажмите на исчерпывающую кнопку. Введите id1 в окне поиска и нажмите кнопку отправки и кнопку запуска анализа .
    3. При исчерпывающем прогностическом анализе выберите Нм, МВР, Mr в критериях народонаселения и событий и нажмите кнопку отправки , чтобы получить больше информации. Нажмите Каплан-Мейер кривой эскизы для экспорта полный графики.
      Примечание: N (+,-, m): узловой статус (+: положительный,-: отрицательный, м: смешанный); ER (+,-, м): состояние эстрогенных рецепторов (+: положительный,-: отрицательный, м: смешанный); MR: метастатический рецидив
  2. Анализ выживаемости в атласе человеческого протеина (HPA)
    1. Перейти на человеческий протеин Атлас веб-интерфейс29.
    2. Введите id1 в поле поиска и нажмите кнопку поиска . Выберите суб-Атлас патологии .
      Примечание: уровни экспрессии мРНК по 17 типам рака показаны в разделе Обзор РНК-выражений. Каждый ярлык ткани рака коробки участка является интерактивными для доступа к подробной странице предоставления данных анализа выживаемости и уровни экспрессии РНК.
    3. Нажмите на этикетке рака молочной железы, а затем подробную страницу, чтобы показать интерактивный разброс сюжет выживания и анализа выживаемости. Скачать цифры.
  3. Анализ выживаемости в Каплан-Мейера выживания плоттера
    1. Перейти к Каплан-Мейер плоттер веб-интерфейс30. Щелкните старт км плоттер для рака молочной железы в генных микросхем мРНК.
    2. Введите id1 в панель поиска и выберите зеленую деталь в меню кандидата.
    3. Выберите RFS как тип выживания и другие элементы остаются по умолчанию. Нажмите рисовать Каплан-Мейер сюжет и скачать цифры.
      Примечание: настройки типов выживания, типов отсечки и порога последующей работы, а также параметры набора зонда могут быть изменены по мере необходимости. Прогностический анализ подгрупп, включающий ER, PR, HER-2, лимфоузлы, класс, Tp53 статус и молекулярные типы, можно получить путем изменения параметра в анализе ограничения на подтипы Box1. Аналогичным образом, ограничение фильтра лечения может быть установлено в ограничении анализа в поле выбранного когорты.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Репрезентативный результат интеллектуального анализа данных и комплексный анализ биомаркеров рака молочной железы был выполнен с использованием ID1, одного из ингибиторов ДНК-связывающих членов семьи, которые были зарегистрированы в предыдущем исследовании 25.

Как показано на рисунке 2, различия экспрессии id1 мРНК между опухолями и нормальными тканями в различных типах рака анализировались с использованием базы данных ONCOMINE, которая содержала в общей сложности 445 уникальных анализов. Было выявлено 5 исследований, которые показали, что уровень экспрессии мРНК в ID1 был значительно выше в нормальных тканях, чем в тканях рака молочной железы. Эти данные свидетельствуют о дисрегуляции экспрессии ID1 при раке молочной железы. На рисунке 3 показан лучший положительный и отрицательный Коррелогенный ген id1 из анализа, который выполняется в БК-Генэксмайнер v 4.0. Для определения корреляции между мРНК экспрессией ID1 и клинопатологическими параметрами БК были использованы базы данных БК-Генэксмайнер v 4.0. Как показано на рисунке 4, значительно увеличен уровень МРНК id1 был обнаружен у больных раком молочной железы без метастазов в лимфатических узлах, по сравнению с метастазами лимфатических узлов (P= 0,0005). Кроме того, анализ в GOBO показал, что повышенный уровень мРНК ID1 коррелирует с меньшим сортом опухоли (Диаграмма 5, P< 0.00001). Эти результаты подразумевали, что увеличение экспрессии ID1 было связано с меньшим метастатическим потенциалом и снижением патологического уровня в Британской Колумбии. Анализ базы данных BC-GenExMiner v 4.0 показал, что более высокий уровень мРНК ID1 коррелирует с более отдаленным метастазом-свободным выживаемости (ДМФА) у больных раком молочной железы (рис. 6, HR = 0.82, 95% CI: 0.73-0.92, P= 0,001). Последовательно, анализ от людского протеина Атлас предложило что повышенный уровень протеина ID1 был связан с более лучшим исходом выживания в пациентах рака молочной железы (Диаграмма 7, P= 0,0389). Анализ выживаемости от Каплан-Мейер плоттер также показали, что высшее мРНК уровень экспрессии ID1 предсказал лучше рецидива свободных выживание (RFS) у больных раком молочной железы (рис. 8, HR = 0.81, P= 0,00023).

Figure 1
На рисунке 1. Обзор изучения шаблонов выражений и прогностических значений различных биомаркеров рака молочной железы и выбора онлайновых баз данных. Систематический анализ различных биомаркеров рака молочной железы был выполнен шаг за шагом в различных базах данных. Во-первых, шаблон экспрессии гена интереса к раковым образцам против нормальных образцов. Затем было выполнено соотношение экспрессии генов, представляющих интерес при раке молочной железы. Далее, профили выражения ID1 был расслаивается в зависимости от различных. Наконец, была проанализирована связь между выражением ID1 и выживаемости. Пожалуйста, нажмите здесь, чтобы посмотреть увеличенном варианте этой фигуры.

Figure 2
Рисунке 2. Модель экспрессии мРНК ID1 в различных типах рака человека. Выражение мРНК id1 проанализировано с базой данных ONCOMINE. На графике показано количество наборов данных со статистически значимой гиперэкспрессией мРНК (красная) или нисходящее регулируемое выражение (синий) целевого гена. Число в каждой ячейке представляет собой количество анализов, которые соответствуют порогу в рамках этих анализов и типов рака. Ранг гена был проанализирован процентилем целевого гена в верхней части всех генов измеренных в каждом исследовании. Цвет клетки был определен лучшим геном ранжировать процентилем для анализов внутри клетка. P-значение было установлено в 0,01 и раз-изменение было определено как 2, как показано в красном кадре. Эта цифра была изменена по сравнению с предыдущим исследованием25. Пожалуйста, нажмите здесь, чтобы посмотреть увеличенном варианте этой фигуры.

Figure 3
Рисунке 3. Анализ гена корреляции ID1 в БК-Генэксмайнер v 4.0. Корреляция экспрессии мРНК ID1 и соответствующих генов в 5, 696 больных раком молочной железы в 36 исследованиях, проанализированных в bcGenExMiner v 4.0. Эта цифра была изменена по сравнению с предыдущим исследованием25. Пожалуйста, нажмите здесь, чтобы посмотреть увеличенном варианте этой фигуры.

Figure 4
На рисунке 4. Взаимосвязь между выражением ID1 и метастазом статуса лимфатических узлов. Уровень экспрессии мРНК ID1 в 4, 307 больных раком молочной железы с различным состоянием лимфатических узлов (НН) проанализирован в bcGenExMiner v 4.0. Эта цифра была изменена по сравнению с предыдущим исследованием25. Пожалуйста, нажмите здесь, чтобы посмотреть увеличенном варианте этой фигуры.

Figure 5
На рисунке 5. Взаимосвязь между уровнем экспрессии генов ID1 и сортом опухоли. В GOBO был проанализирован уровень экспрессии мРНК ID1 у больных раком молочной железы с различной патологической степенью. Глобальная существенная разница между группами оценивалась с целью создания p-значений, а p< 0, как считалось, указывает на статистически значимое различие. 1, 2, 3 в x-оси стенд для подгрупп пациентов в различных патологических класс 1, класс 2, класс 3. Эта цифра была изменена по сравнению с предыдущим исследованием 25. Пожалуйста, нажмите здесь, чтобы посмотреть увеличенном варианте этой фигуры.

Figure 6
На рисунке 6. Прогностические значения ID1 для отдаленных метастазов-свободное выживание у больных раком молочной железы. Связь между уровнями ID1 мРНК и дистанци-свободными оценками выживаемости была проанализирована в bcGenExMiner v 4.0. Эта цифра была изменена по сравнению с предыдущим исследованием25. Пожалуйста, нажмите здесь, чтобы посмотреть увеличенном варианте этой фигуры.

Figure 7
На рисунке 7. Вероятность выживания ID1 у больных раком молочной железы.  Влияние уровня белка ID1 для выживания пациентов с раком молочной железы был проанализирован в человеческом атласе белков (HPA). Эта цифра была изменена по сравнению с предыдущим исследованием25. Пожалуйста, нажмите здесь, чтобы посмотреть увеличенном варианте этой фигуры.

Figure 8
Рисунок 8. Прогностические значения ID1 в раке молочной железы в зависимости от рецидивирующего выживания (RFS). Различные id1 мРНК уровне во всех 3, 951 больных раком молочной железы проанализированы в Каплан-Мейер плоттера. Эта цифра была изменена по сравнению с предыдущим исследованием25. Пожалуйста, нажмите здесь, чтобы посмотреть увеличенном варианте этой фигуры.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Всесторонний анализ публичных баз данных может указывать на основную функцию гена интересов и выявить потенциальную связь между этим геном и клиникопатологическими параметрами в специфическом раке27,31. Исследование и анализ, основанные на одной единственной базе данных, могут обеспечить ограниченные или изолированные перспективы из-за потенциального смещения отбора или в определенной степени, возможно, из-за разнообразия качества данных, включая сбор данных и аналитический алгоритм базы данных19. Наиболее важным этапом этого протокола является выбор соответствующих баз данных, которые должны широко признаваться большим числом ученых, обладающих адекватной репрезентативностью. Следователь должен использовать несколько баз данных для проверки гипотезы и подтверждения результатов, полученных из различных баз данных, а не использовать единую базу данных.

Протокол описано здесь следователь дружественной операции процедуры. Преимуществом этого метода является то, что он позволяет быстро визуализировать и интерпретировать потенциальную роль гена в раке молочной железы. Более того, все результаты, полученные в ходе этой процедуры, можно сразу протестировать и повторить, просто запрашив соответствующие веб-сайты. Ограничением этого метода является то, что выводы, которые приходят из всеобъемлющего анализа баз данных может точно не отражать фактические функции или отношения в клинических условиях. Это может вытекать из систематического смещения базы данных, а в некоторых случаях, возможно, из-за недостаточного размера выборки32,33. Использование более чем одной базы данных для запроса одного и того же вопроса исследования может взаимно подтвердить результаты и повысить достоверность заключения34. Настоятельно рекомендуется использовать образцы из Института следователя для проверки результатов, или, если возможно, для выполнения соответствующих базовых экспериментов для проверки результатов.

Все больше и больше онлайн-геномики рака и баз протеомики будут доступны и доступны для исследователей35,36. Протокол может обеспечить эффективный и экономичный метод для исследователя, чтобы определить потенциальный целевой ген и связанный сигнальный путь через глубокий анализ онлайновых баз данных и с помощью геномики, транскриптомики и эпигеномики Подход.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторам нечего раскрывать

Acknowledgments

Эта работа была частично поддерживается Фондом естественных наук провинции Гуандун, Китай (No. 030313562), учебный проект реформы Гуандунской клинической обучаемой базы (NO.  2016JDB092), Национальный фонд естественных наук Китая (81600358), и молодежный инновационный проект талантов колледжей и университетов в провинции Гуандун, Китай (NO. 2017 KQNCX073)

Materials

Name Company Catalog Number Comments
A personal computer or computing device with an Internet browser with Javascript
enabled
Microsoft 051690762553 We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above
Adobe Flash player Adobe Systems Inc. It can be freely downloaded from http://get.adobe.com/flashplayer/. This browser plug-in is required for visualizing networks on the network
analysis tab.
Chrome Broswer Google Inc. It can be freely downloaded from https://www.google.cn/chrome/ This is necessary for viewing PDF files including the Pathology Reports and many of
the downloadable files.
Java Runtime Environment Oracle Corporation It can be downloaded from http://www.java.com/getjava/.
Office 365 ProPlus for Faculty Microsoft 2003BFFD8117EA68 This is necessary for viewing the Pathology Reports and for viewing many of
the downloadable files.
Vectr Online Vectr Labs Inc. It can be freely used from https://vectr.com/new This is necessary for visualizing and editing many of
the downloadable files and pictures.

DOWNLOAD MATERIALS LIST

References

  1. van 't Veer, L. J., et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 415 (6871), 530-536 (2002).
  2. Loi, S., et al. Definition of clinically distinct molecular subtypes in estrogen receptor-positive breast carcinomas through genomic grade. Journal of Clinical Oncology. 25 (10), 1239-1246 (2007).
  3. Cancer Genome Atlas, N. Comprehensive molecular portraits of human breast tumours. Nature. 490 (7418), 61-70 (2012).
  4. Emerson, J. W., Dolled-Filhart, M., Harris, L., Rimm, D. L., Tuck, D. P. Quantitative assessment of tissue biomarkers and construction of a model to predict outcome in breast cancer using multiple imputation. Cancer Informatics. 7, 29-40 (2009).
  5. Yu, H., et al. Integrative genomic and transcriptomic analysis for pinpointing recurrent alterations of plant homeodomain genes and their clinical significance in breast cancer. Oncotarget. 8 (8), 13099-13115 (2017).
  6. He, W., et al. TCGA datasetbased construction and integrated analysis of aberrantly expressed long noncoding RNA mediated competing endogenous RNA network in gastric cancer. Oncology Reports. , (2018).
  7. Liu, J., et al. An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics. Cell. 173 (2), e411 400-416 (2018).
  8. Esgueva, R., et al. Next-generation prostate cancer biobanking: toward a processing protocol amenable for the International Cancer Genome Consortium. Diagnostic Molecular Pathology. 21 (2), 61-68 (2012).
  9. Joly, Y., Dove, E. S., Knoppers, B. M., Bobrow, M., Chalmers, D. Data sharing in the post-genomic world: the experience of the International Cancer Genome Consortium (ICGC) Data Access Compliance Office (DACO). PLoS Computational Biology. 8 (7), e1002549 (2012).
  10. Zhang, J., et al. International Cancer Genome Consortium Data Portal--a one-stop shop for cancer genomics data. Database (Oxford). 2011, bar026 (2011).
  11. Rhodes, D. R., et al. ONCOMINE: a cancer microarray database and integrated data-mining platform. Neoplasia. 6 (1), 1-6 (2004).
  12. Rhodes, D. R., et al. Oncomine 3.0: genes, pathways, and networks in a collection of 18,000 cancer gene expression profiles. Neoplasia. 9 (2), 166-180 (2007).
  13. Jezequel, P., et al. bc-GenExMiner: an easy-to-use online platform for gene prognostic analyses in breast cancer. Breast Cancer Research and Treatment. 131 (3), 765-775 (2012).
  14. , Available from: http://co.bmc.lu.se/gobo/gsa.plb (2018).
  15. Ringner, M., Fredlund, E., Hakkinen, J., Borg, A., Staaf, J. GOBO: gene expression-based outcome for breast cancer online. PLoS One. 6 (3), e17911 (2011).
  16. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  17. Ponten, F., Schwenk, J. M., Asplund, A., Edqvist, P. H. The Human Protein Atlas as a proteomic resource for biomarker discovery. Journal of Internal Medicine. 270 (5), 428-446 (2011).
  18. Gyorffy, B., et al. An online survival analysis tool to rapidly assess the effect of 22,277 genes on breast cancer prognosis using microarray data of 1,809 patients. Breast Cancer Research and Treatment. 123 (3), 725-731 (2010).
  19. Stevinson, C., Lawlor, D. A. Searching multiple databases for systematic reviews: added value or diminishing returns? Complementary Therapies in Medicine. 12 (4), 228-232 (2004).
  20. Yin, J., et al. Integrating multiple genome annotation databases improves the interpretation of microarray gene expression data. BMC Genomics. 11, 50 (2010).
  21. Patel, D., Morton, D. J., Carey, J., Havrda, M. C., Chaudhary, J. Inhibitor of differentiation 4 (ID4): From development to cancer. Biochimica et Biophysica Acta. 1855 (1), 92-103 (2015).
  22. Kamalian, L., et al. Increased expression of Id family proteins in small cell lung cancer and its prognostic significance. Clinical Cancer Research. 14 (8), 2318-2325 (2008).
  23. Cruz-Rodriguez, N., et al. High expression of ID family and IGJ genes signature as predictor of low induction treatment response and worst survival in adult Hispanic patients with B-acute lymphoblastic leukemia. Journal of Experimental and Clinical Cancer Research. 35, 64 (2016).
  24. Yang, H. Y., et al. Expression and prognostic value of Id protein family in human breast carcinoma. Oncology Reports. 23 (2), 321-328 (2010).
  25. Zhou, X. L., et al. Prognostic values of the inhibitor of DNAbinding family members in breast cancer. Oncology Reports. 40 (4), 1897-1906 (2018).
  26. , Available from: https://www.oncomine.org (2018).
  27. Lin, H. Y., Zeng, L., iang, Y. K., Wei, X. L., Chen, C. F. GATA3 and TRPS1 are distinct biomarkers and prognostic factors in breast cancer: database mining for GATA family members in malignancies. Oncotarget. 8 (21), 34750-34761 (2017).
  28. , Available from: http://bcgenex.centregauducheau.fr/BCGEM/GEM-requete.php (2018).
  29. , Available from: https://www.proteinatlas.org (2018).
  30. , Available from: http://kmplot.com/analysis (2018).
  31. Zhu, Y. F., Dong, M. Expression of TUSC3 and its prognostic significance in colorectal cancer. Pathology-Research and Practice. 214 (9), 1497-1503 (2018).
  32. Nelson, J. C., et al. Validation sampling can reduce bias in health care database studies: an illustration using influenza vaccination effectiveness. Journal of Clinical Epidemiology. 66 (8 Suppl), S110-S121 (2013).
  33. Haibe-Kains, B., Desmedt, C., Sotiriou, C., Bontempi, G. A comparative study of survival models for breast cancer prognostication based on microarray data: does a single gene beat them all? Bioinformatics. 24 (19), 2200-2208 (2008).
  34. Yang, C., et al. Understanding genetic toxicity through data mining: the process of building knowledge by integrating multiple genetic toxicity databases. Toxicology Mechanisms and Methods. 18 (2-3), 277-295 (2008).
  35. Cannata, N., Merelli, E., Altman, R. B. Time to organize the bioinformatics resourceome. PLoS Computational Biology. 1 (7), e76 (2005).
  36. Wren, J. D., Bateman, A. Databases, data tombs and dust in the wind. Bioinformatics. 24 (19), 2127-2128 (2008).

Tags

Онкологическое исследование выпуск 147 рак молочной железы биомаркер база данных майнинг прогноз Биоинформация
Выполнение интеллектуального анализа данных и интегративный анализ биомаркеров в раке молочной железы с использованием нескольких публично доступных баз данных
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Chen, M. n., Zeng, D., Zheng, Z. q., More

Chen, M. n., Zeng, D., Zheng, Z. q., Li, Z., Wu, J. l., Jin, J. y., Wang, H. j., Huang, C. z., Lin, H. y. Performing Data Mining And Integrative Analysis Of Biomarker in Breast Cancer Using Multiple Publicly Accessible Databases. J. Vis. Exp. (147), e59238, doi:10.3791/59238 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter