Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Навигация MARRVEL, веб-инструмент, который интегрирует геномику человека и модель генетики организма информации

Published: August 15, 2019 doi: 10.3791/59542

Summary

Здесь мы представляем протокол для эффективного доступа и анализа многих баз данных человеческих и модельных организмов. Этот протокол демонстрирует использование MARRVEL для анализа вариантов, вызывающих болезни, которые были определены в ходе усилий по секвенированию следующего поколения.

Abstract

С помощью секвенирования всего экзома/генома генетики человека выявляют редкие варианты, которые сегрегируются с фенотипами болезни. Чтобы оценить, является ли конкретный вариант патогенным, необходимо задать вопрос о многих базах данных, чтобы определить, связан ли ген интереса с генетическим заболеванием, был ли конкретный вариант зарегистрирован ранее и какие функциональные данные имеются в модельном организме базы данных, которые могут дать подсказки о функции гена в человеке. MARRVEL (Модель организма Агрегированные ресурсы для редкого варианта ExpLoration) является единым инструментом сбора данных для человеческих генов и вариантов и их ортоломных генов в семи модельных организмах, включая мышь, крысу, зебры, плодовую муху, нематодный червь, расщепление дрожжи, и подающий надежды дрожжи. В этом Протоколе мы предоставляем обзор того, для чего можно использовать MARRVEL, и обсуждаем, как различные наборы данных могут быть использованы для оценки того, может ли вариант неизвестного значения (VUS) в известном гене, вызывающего болезни, или вариант в гене неопределенного значения (GUS) Патогенных. Этот протокол будет направлять пользователя путем поиска нескольких человеческих баз данных одновременно, начиная с человеческого гена с или без варианта интереса. Мы также обсуждаем, как использовать данные от OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV и DECHIPHER. Кроме того, мы иллюстрируем, как интерпретировать список генов ортологовых кандидатов, моделей экспрессии и терминов GO в модельных организмах, связанных с каждым человеческим геном. Кроме того, мы обсуждаем значение белка структурных областей аннотации при условии, и объяснить, как использовать функцию выравнивания нескольких видов белка для оценки того, вариант интереса влияет на эволюционно сохраненной области или аминокислоты. Наконец, мы обсудим три различных случаях использования этого сайта. MARRVEL является легкодоступным веб-сайтом открытого доступа, предназначенным как для клинических, так и для основных исследователей и служит отправной точкой для разработки экспериментов для функциональных исследований.

Introduction

Использование технологии секвенирования следующего поколения расширяется как в исследовательских, так и в клинических генетических лабораториях1. Анализы секвенирования всего генома (WGS) выявили многочисленные редкие варианты неизвестного значения (VUS) в известных болезнетворных генах, а также варианты генов, которые еще не связаны с менделейской болезнью (ГУС: гены неопределенные значение). Представленный со списком генов и вариантов в отчете о клинической последовательности, медицинские генетики должны вручную посетить несколько интернет-ресурсов, чтобы получить больше информации, чтобы оценить, какой вариант может быть ответственным за определенный фенотип, замеченный у интересующего пациента . Этот процесс занимает много времени, и его эффективность в значительной степени зависит от квалификации человека. Хотя было опубликованонесколькоруководящих документов 2,3, интерпретация WES и WGS требует ручного кураторства, поскольку еще предстоит стандартизированная методология для анализа вариантов. Для интерпретации VUS, знания о ранее сообщалось генотип-фенотип отношения, режим наследования, и аллеле частоты в общей популяции становятся ценными. Кроме того, знания о том, влияет ли этот вариант на критический белковый домен или эволюционно сохраненный остаток, могут увеличить или уменьшить вероятность патогенности. Чтобы собрать всю эту информацию, обычно необходимо перемещаться по 10-20 базам данных человеческих и модельных организмов, так как информация разбросана по Всемирной паутине.

Аналогичным образом, ученые-модели организмов, которые работают над конкретными генами и путями, часто заинтересованы в подключении своих выводов к механизмам заболеваний человека и хотят воспользоваться знаниями, которые генерируются в области геномики человека. Однако из-за быстрого расширения и эволюции наборов данных о геноме человека было трудно определить базы данных, которые предоставляют полезную информацию. Кроме того, поскольку большинство типовых баз данных организмов предназначены для исследователей, которые работают с конкретным организмом на ежедневной основе, очень трудно, например, для мыши исследователь для поиска конкретной информации в базе данных Drosophila и наоборот. Подобно варианту интерпретации поисков, выполненных медицинскими генетиками, выявление полезной информации о организме человека и другой модели человека занимает много времени и сильно зависит от фона модельного исследователя организма. MARRVEL (Модель организма Агрегированные ресурсы для редкого варианта ExpLoration)4 является инструментом, предназначенным для обеих групп пользователей, чтобы упорядочить их рабочий процесс.

MARRVEL (http://marrvel.org) был разработан как централизованная поисковая система, которая систематически собирает данные эффективным и последовательным образом для клиницистов и исследователей. С информацией из 20 или более общедоступных баз данных, эта программа позволяет пользователям быстро собирать информацию и получить доступ к большому количеству человеческих и модельных баз данных организма без повторного поиска. Страницы результатов поиска также содержат гиперссылки на исходные источники информации, позволяющие людям получить доступ к необработанным данным и собрать дополнительную информацию, предоставленную источниками.

В отличие от многих инструментов определения приоритетов, которые требуют большого секвенирования данных в виде файлов VCF или BAM и установок часто несвободного/коммерческого программного обеспечения, MARRVEL работает на любом веб-браузере. Он может быть использован на безсредствную стоимость и совместим с портативными устройствами (например, смартфоны, планшеты) до тех пор, как один подключен к Интернету. Мы выбрали этот формат, так как многие врачи и исследователи, как правило, необходимо искать один или несколько генов и вариантов за один раз. Обратите внимание, что мы разрабатываем пакетную загрузку и API (интерфейс прикладного программирования) для MARRVEL, чтобы в конечном итоге позволить пользователям курировать сотни генов и вариантов одновременно с помощью индивидуальных инструментов запроса, если это необходимо.

Благодаря широкому спектру приложений в этом протоколе мы описаем широко охватывающий подход к навигации по различным наборам данных, которые отображает MARRVEL. Более целенаправленные примеры, адаптированные к потребностям конкретных пользователей, будут описаны в разделе «Результаты представлений». Важно отметить, что выход MARRVEL по-прежнему требует определенного уровня фоновых знаний в генетике человека или модели организмов для извлечения ценной информации. Мы направим читателей к таблице, в которой перечислены основные документы, описывающие функцию каждой из исходных баз данных, которые курируются MARRVEL (Таблица 1). Следующий протокол делится на три раздела: (1) Как начать поиск, (2) как интерпретировать выводы генетики человека MARRVEL и (3) как использовать данные модельного организма в MARRVEL. В разделе «Результаты представительов» описаны более целенаправленные и конкретные подходы. MARRVEL активно обновляется, поэтому, пожалуйста, обратитесь к странице часто задаваемых вопросов текущего веб-сайта для получения подробной информации об источниках данных. Мы настоятельно рекомендуем пользователям MARRVEL зарегистрироваться для получения уведомлений об обновлении через форму отправки электронной почты в нижней части главной страницы MARRVEL.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Как начать поиск

  1. Для поиска гена человека и варианта, перейдите на шаги 1.1.1.-1.1.2. Для поиска на основе генов человека (без вариантов ввода) перейдите к шагу 1.2. Для поиска генов на основе модели организма отсылай к шагам 1.3.1.-1.3.2.
    1. Перейдите на главную страницу MARRVEL4 в http://marrvel.org/. Начните с ввода символа гена человека. Убедитесь, что имена генов-кандидатов перечислены ниже входного поля с каждой записью персонажа. Если поиск возвращается отрицательным, убедитесь, что используемый символ гена актуален с помощью веб-сайта Комитета по номенклатуре HUGO Gene Nomenclature5 (HGNC; https://www.genenames.org/).
    2. Введите человеческий вариант. Панель поиска совместима с двумя типами вариантной номенклатуры: расположение генома, аналогичное тому, как варианты отображаются на ExAC и GnomAD 6, и номенклатура на основе стенограммы в соответствии с руководящими принципами HGVS. Примеры таких форматов отображаются серым текстом в поле поиска. Для номенклатуры геномного расположения используйте координаты в соответствии с hg19/GRCh37. Приступить к шагу 2.
      ПРИМЕЧАНИЕ: Если поиск возвращает ошибку, наиболее распространенными проблемами являются либо символ гена не в курсе или вариант номенклатуры является неправильным. В этих случаях веб-сайты HGNC (https://www.genenames.org/), Mutalyzer7 (https://www.mutalyzer.nl/) и TransVar8 (https://bioinformatics.mdanderson.org/transvar/) являются большими ресурсами для исправления ошибки. HGNC предоставляет официальные символы генов и их псевдонимы для всех человеческих генов.
    3. Если все еще сталкиваются сообщения об ошибке после подтверждения имени гена в актуальном состоянии, используйте Mutalyzer и TransVar для проверки и преобразования варианта номенклатуры.
    4. В некоторых ситуациях, таких как недавнее изменение символа гена в HGNC, попробуйте использовать синоним гена и, пожалуйста, свяжитесь с операционной командой MARRVEL, используя вкладку "Обратная связь", чтобы обновить исходные данные, так как MARRVEL может не предоставить правильную информацию из-за запаздывания в данных Дата.
  2. Введите символ гена человека и оставьте пробел в панели поиска человеческого варианта. Если обнаружена ошибка, перейдите в HGNC (https://www.genenames.org/), чтобы проверить официальный символ гена или попробовать старый символ гена.
    1. Нажмите на вкладку Поиска модели на верхнем баннере (рисунок1)или перейдите на http://marrvel.org/model. Выберите модель выбранного организма и введите символ гена гена модельного организма. Нажмите на символ гена, как имя автозавершено, а затем нажмите Поиск. Если результат поиска отрицательный, проверьте официальный символ гена, который используется в базах данных модельного организма(таблица 1).
    2. Если результат поиска по-прежнему отрицательный, доступ к DIOPT (DRSC Интегративный инструмент ортомного прогнозирования, https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) и HCOP (https://www.genenames.org/tools/hcop/), чтобы оценить, если Есть нет хороших прогнозируемых ортологов для ген ажиотажа. DIOPT является ортолог прогнозирования поисковой системы в ведении DRSC(Дрозофила РНК Скрининг центр) и HCOP является аналогичный набор разработан HGNC.
      ПРИМЕЧАНИЕ: Дополнительные поиски с использованием BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) могут позволить пользователям найти ортологи, которые могут быть пропущены алгоритмами прогнозирования, используемыми в DIOPT и HCOP.
    3. Нажмите на MARRVEL его в нижней части для предсказанного человека ортог выбора. Проверить DIOPT оценка9 и Лучший балл от гена человека для моделирования организма? для выбора гена человека. Приступай к шагу 2.
      ПРИМЕЧАНИЕ: DIOPT оценка9 (https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) является значение того, сколько алгоритмов ортолога прогнозирования предсказать пару генов в двух организмах, чтобы быть ортолотусом друг к другу. Для получения дополнительной информации об этих значениях и конкретных алгоритмах, используемых для расчета этого балла, обратитесь к Hu et al9. Когда Лучший счет от гена человека к модели организма? Да, это указывает на то, что человеческий ген, скорее всего, истинный человеческий ортолологи гена интерес, но могут быть исключения, особенно когда несколько человеческих генов ортологовые несколько генов модельного организма из-за событий дублирования генов в процессе эволюции. Если ген интереса является членом сложной семьи генов, которые претерпели различные эволюции в нескольких видах, пользователи должны определить публикацию, которая провела обширный филогенетический анализ гена семьи интересов, чтобы определить наиболее вероятно, ортолог кандидат гена.

2. Как интерпретировать MARRVEL человеческих генетики выходы для гена и вариант поиска

ПРИМЕЧАНИЕ: На странице результатов, Есть семь человеческих баз данных, которые отображаются(Таблица 1, Рисунок 1). Для каждой выходной коробки, есть кнопка внешний ссылку(маленькая коробка с диагональной стрелкой)в правом верхнем углу, который будет ссылаться на исходную базу данных для более подробной информации.

  1. Нажмите OMIM (Онлайн Менделеев Наследие в человеке, https://www.omim.org/)10, первая база данных, которая отображается.
    ПРИМЕЧАНИЕ: OMIM является ручной куратор базы данных, которая агрегирует и обобщает информацию о генетических заболеваний и особенностей человека.
    1. Используйте окно описания гена человека от OMIM для краткого резюме того, что известно о гене и гене продукта.
    2. Используйте генно-фенотип отношения поле, чтобы определить, если этот ген является известным заболеванием вызывающих ген или нет. Эта коробка обеспечивает вручную куратор известных заболеваний или фенотипов ассоциаций с геном интереса.
    3. Используйте Сообщаемые аллели из коробки OMIM, чтобы получить список патогенных вариантов, куратором которых является OMIM.
      ПРИМЕЧАНИЕ: Поскольку ручная кураторство публикации относительно нового открытия гена болезни необходимо для любой ассоциации генных заболеваний, чтобы появиться в OMIM, некоторое отставание времени и /или пропущенных публикаций может привести к заблуждению. Рекомендуется, чтобы пользователи выполняли поиск PubMed (https://www.ncbi.nlm.nih.gov/pubmed/), чтобы также ознакомиться с свежей литературой (см. 4.1.2.). Для получения дополнительной информации, куратором в OMIM, обратитесь к Amberger10,11.
  2. НажмитеExAC(Консорциум агрегации экзоме, http://exac.broadinstitute.org/)6и gnomAD(База данных агрегации генома, http://gnomad.broadinstitute.org/), большие базы данных геномики популяции на основе WES и WGS людей, которые выбраны для исключения тяжелых детских заболеваний.
    ПРИМЕЧАНИЕ: ExAC содержит 60 000 евро WES, в то время как gnomAD содержит 120 000 евро WES и 15 000 WGS. Как ExAC, так и gnomAD могут быть использованы в качестве базы данных контроля населения, особенно при тяжелых детских расстройствах, но его интерпретация требует определенной степени осторожности. В целом, gnomAD можно рассматривать как обновленную и расширенную версию ExAC, поскольку большинство когорт, включенных в ExAC, также включены в gnomAD. Однако, поскольку существуют некоторые исключения (см. информацию когорты в http://exac.broadinstitute.org/about и http://gnomad.broadinstitute.org/about соответственно), MARRVEL отображает данные из обоих источников.
    1. Используйте поле Control Population Gene Summary для получения статистических данных на генном уровне, таких как вероятность обнаружения аллелей функции (LOF) в общей популяции. Это называется pLI (вероятность непереносимости LOF) оценка в ExAC и может быть использован анамнез, насколько вероятно, одна копия аллеля LOF для конкретного гена может вызвать доминирующее заболевание через гапло-недостаточно механизмов.
      ПРИМЕЧАНИЕ: Глядя на pLI оценка гена имеет значение, особенно при работе с доминирующими расстройствами, которые представляют как тяжелые детские заболевания, связанные с de novo вариантов. Если ген имеет оценку pLI 0.00, то значит оно высоки терпимо вариантов LOF таким образом ген маловероятный причиняет заболевание через доминантный механизм haploinsufficiency. Это, однако, не обязательно исключает другие доминирующие выгоды функции (GOF) или доминирующих негативных опосредовано механизмов может вызвать болезнь. Кроме того, гены, которые вызывают рецессивные заболевания могут иметь низкие баллы pLI, так как карьера, как ожидается, будет найден в общей популяции. С другой стороны, если ген имеет pLI оценка 1,00, вполне возможно, что потеря одной копии этого гена наносит ущерб для здоровья человека. Дополнительные поиски на веб-сайтах, таких как DOMINO (https://wwwfbm.unil.ch/domino/) также могут быть использованы в комбинации для оценки вероятности варианта в конкретном гене вызывает доминирующее расстройство.
    2. Используйте следующие две коробки, чтобы получить частоты аллелей варианта интереса к ExAC и gnomAD, соответственно, чтобы помочь интерпретировать или нет вариант может быть патогенным в зависимости от того, если пациент имеет доминирующей или рецессивной болезни. Это поле будет отображаться только при ввода хиверсии пользователя при начале поиска.
      ПРИМЕЧАНИЕ: Если один предполагает рецессивный сценарий болезни и pLI оценка гена интерес низкий, следует обратить внимание на частоту аллелей, перечисленных здесь. Некоторые генетики могут установить точку отсечения от 0,005 до 0,0001 в качестве максимальной частоты аллелей для патогенных вариантов, которые могут вызвать тяжелое рецессивно наследственных заболеваний2. С другой стороны, если предположить доминирующий сценарий болезни, то менее вероятно, чтобы найти идентичный или аналогичный вариант в контрольной популяции. Опять же, это требует осторожности, потому что лица с позднего начала расстройств, заболеваний с мягким представлением, психических расстройств или заболеваний, не скрининг ExAC / gnomAD исследователи могут быть по-прежнему включены и вариант все еще может быть доминирующим патогенных Вариант. Кроме того, были некоторые случаи вариантов, связанных с педиатрическими условиями, найденными в нескольких людях в этих базах данных12,13,14, потенциально из-за неполного пенетранса или соматического мозаики13 , 15 лет , 16. Кроме того, хотя ExAC и gnomAD будут отображать варианты, которые находятся в гомозиготном состоянии, он не будет указывать, являются ли какие-либо из вариантов находятся в соединении гетерозиготного состояния. Наконец, некоторые варианты, найденные в этих базах данных, помечаются как низкое доверие из-за технических проблем в последовательности (например, низкий охват последовательности, повторяющаяся последовательность). Чтобы более внимательно изучить эти наборы данных, пользователям рекомендуется использовать кнопку внешней ссылки для посещения исходных веб-сайтов ExAC и gnomAD для получения дополнительной информации.
  3. Нажмите Geno2MP (Генотип для Менделиана Фенотип браузер, http://geno2mp.gs.washington.edu/Geno2MP/), коллекция WES основе данных из Университета Вашингтона Центр менделянской генетики. Он содержит около 9600 экзомов (по состоянию на 1/18/2019) пострадавших лиц и незатронутых родственников с некоторыми фенотипическими описаниями(рисунок 1).
    1. Используйте поле популяции болезни, чтобы получить частоту аллелей варианта интереса к этой когорте.
    2. Используйте джин-фенотип Отношения поле для получения HPO (генотип человека онтологии)17 терминов для лиц с вариантом интереса. Это один из многих способов для одного, чтобы искать пациентов, которые могут иметь то же заболевание.
      ПРИМЕЧАНИЕ: Если ген интереса подозревается, что связан с болезнью пациента и Есть совпадения, найденные в Geno2MP, дополнительная важная информация может присутствовать в источнике данных за то, что отображается.
      1. Нажмите кнопку внешней ссылки на генную страницу на Geno2MP, отфильтруйте мутации, аналогичные мутациям пациента (например, missense, LOF) и внимательно просмотрите списки вариантов. Обратите внимание на варианты с высокими баллами CADD18 и нажмите на профили HPO. Например, оценки CADD, превышаюющие 20, находятся в пределах 1% всех вариантов, которые, по прогнозам, будут пагубными, оценки CADD, которые превышают 10, находятся в пределах 10% лучших. Термины HPO предусматривают стандартизированное описание человеческих фенотипов. Здесь убедитесь, что проверить, если вариант был идентифицирован в пострадавших лиц или в родственника.
      2. Если варианты найдены у пациентов, которые страдают в той же системе органов, как пациент, рассмотреть вопрос об использовании формы электронной почты, чтобы связаться с врачом, который представил эти случаи В Geno2MP с помощью функции, представленной на веб-сайте Geno2MP.
        ПРИМЕЧАНИЕ: Не все врачи отвечают на такие вопросы, поэтому следует изучить другие возможности сватовства пациентов. Другие способы собрать когорту пациентов, пострадавших от тех же заболеваний является использование таких инструментов, как GeneMatcher19 (https://www.genematcher.org/) и другие базы данных, которые являются частью Matchmaker Exchange19,20 ( https://www.matchmakerexchange.org/). Смотрите сопроводительную статью JoVE для получения дополнительной информации о сватовство21.
  4. Используйте базу данных ClinVar (https://www.ncbi.nlm.nih.gov/clinvar/)22, поддерживаемую Национальными институтами здравоохранения (NIH), где исследователи и клиницисты представляют варианты с или без определения патогенности, для проверки варианты одного нуклеотида (SNV), небольшие indels и большие вариации числа копий (CNV).
    1. Используйте верхний ряд, чтобы просмотреть резюме числа вариантов каждого типа, о которых сообщается в ClinVar(рисунок1).
    2. Проверьте список вариантов ниже в поле Сообщили Аллели от ClinVar.
      ПРИМЕЧАНИЕ: Если вариант был включен в первоначальный поиск, выделенные варианты в чирок все варианты, которые включают в себя геномное расположение варианта интереса ,в том числе крупных CNV, которые часто помечены как; геномные координаты ... x1 (удаление) и ... x3 (дублирование)».
  5. Используйте DGV23 (База геномных вариантов, http://dgv.tcag.ca/dgv/app/home) и DECIPHER24 (DatabasE из геномийки и фенотипа у людей с помощью Ресурсов Ensembl, https://decipher.sanger.ac.uk/), оба коллекции CNVs. DGV является крупнейшим общедоступным коллекцией структурных вариантов от более чем 54 000 человек. Эта база данных включает образцы, как сообщается, здоровых людей, на момент установления, от до 72 различных исследований. Аналогичным образом, данные, отображаемые из DECIPHER, включают общие варианты из группы управления.
    ПРИМЕЧАНИЕ: Поскольку MARRVEL не имеет разрешения на отображение данных о пациентах, полученных от DECIPHIER, пользователям рекомендуется непосредственно посещать веб-сайт DECIPHER для доступа к потенциально патогенной информации CNV.
    1. Нажмите на изменение количества копий в базе данных управления (DGV Database) для получения вариантов, содержащих интересующие гены. В одном поле можно найти такую информацию, как размер, подтип и ссылка на вариацию номера копии.
    2. Нажмите в поле Common Copy Number Variants (DECIPHER Database), чтобы получить варианты, содержащие геномное расположение варианта интереса. Эта информация может помочь определить, если ген дублируется или удаляется в контрольных лиц.
      ПРИМЕЧАНИЕ: Если ген интереса удаляется у многих людей в контрольной популяции, это означает, что этот ген, вероятно, будет очень терпимым к вариантам LOF. Как низкие оценки pLI, это говорит о том, что одна потеря копии этого гена менее вероятно, чтобы вызвать тяжелое заболевание через механизм гаплоинесификции. Это, однако, не обязательно исключает другие доминирующие прироста функциональных или доминирующих отрицательных механизмов (например, антиморфные, гиперморфные и неоморфные аллели), вызванные специфическими несмысличными и усечением аллелей.  Возможные ограничения этих данных включают изменение источника и метода полученных данных, отсутствие информации о неполном пенетрансе патогенных CNV и о том, развились ли у людей определенные заболевания после сбора данных.

3. Как использовать данные о модельном организме в MARRVEL

  1. Используйте таблицу функций гена для получения следующей информации для восьми модельных организмов, включая человека (человека, крысу, мышь, зебры, дрозофилы, C elegans, подающий надежды дрожжей и дрожжей деления):
    1. Имя гена: Поскольку каждое имя гена гиперсвязано со страницами генов в соответствующих базах данных организмов модели, нажмите на эти ссылки, чтобы узнать больше о фенотипической информации и ресурсах, доступных для каждого модельного организма. Например, на FlyBase25 (http://flybase.org/) будет список всех сгенерированных аллелей, соответствующих фенотипов и наличие каждого аллеля из общественных фондовых центров.
    2. PubMed ссылку: Нажмите на PubMed ссылку, чтобы перейти к списку публикаций, которые относятся к гену интерес в каждом организме. Без использования этих связей, поиск человеческого гена непосредственно в PubMed может привести к пропавшим без вести некоторые публикации, которые использовали старый псевдоним гена для обозначения человеческого гена. Аналогичным образом, типовые названия генов организма, возможно, колебались исторически.
    3. ДИОПТ 9 баллов: Проверьте эту колонку для оценки того, сколько алгоритмов ортолога прогнозирования предсказать ген, вероятно, будет ортолог человеческого гена интереса. Можно использовать DIOPT оценка 3 или выше, как разумный отсечения для выявления твердых кандидатов орфолога. Однако, Есть случаи, когда подлинные ортолоты только DIOPT оценка 1 из-за ограниченной гомологии. В верхней части таблицы функции гена, ООН-проверить "Показать только лучший DIOPT оценка гена" поле для отображения всех кандидатов, которые обычно включают гомологичные гены, которые не обязательно ортологи.
    4. Выражение: Проверьте этот столбец для списка тканей, где ген или белок, представляющий интерес, как сообщается, выражается в человеческих или модельных баз данных организма. Данные о экспрессии генов и белков человека получены соответственно от GTEx26 (https://gtexportal.org/) и Атласа человеческого белка27 (https://www.proteinatlas.org/. Некоторые из них имеют кнопку с всплывающими ссылками, например, для человека и для мухи, которые отображают шаблон выражения с помощью тепловой карты, в то время как другие гиперссылки на соответствующие страницы баз данных системы модели.
    5. Ген Онтология 28 (GO) термины: Фильтр экспериментальными кодами доказательств и получение из соответствующих баз данных человеческих или модельных организмов. Термины GO, основанные на "кодах доказательств вычислительного анализа" и "электронных кодах доказательств аннотации" (прогнозы), не отображаются. Пожалуйста, посетите каждый веб-сайт модель организма, чтобы собрать эту информацию, если это необходимо.
    6. Другие ссылки, такие как Monarch Initiative29 (https://monarchinitiative.org/) и IMPC30 (http://www.mousephenotype.org/): Используйте гиперссылку Monarch Initiative для навигации по странице Phenogrid для конкретного гена человека, диаграмма, которая обеспечивает быстрое сравнение между фенотипами, связанными с геном, представляющим интерес для известных человеческих заболеваний и модели организма мутантов, которые фенотипические перекрытия. Если ген мыши имеет мышь нокаутом, сделанную или запланированную Международным консорциумом по фенотипированию мышей (IMPC), ссылки на страницу , в котором подробно описан фенотип мыши-нокаута и ее доступность из общественных фондовых центров.
  2. Человек Белковые домены: Используйте поле протеинов гена человека для того чтобы получить предсказанные домены протеина людского гена. Данные получены из DIOPT, который использует Pfam (https://pfam.xfam.org/) и CCD (База данных сохраненных доменов, https://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml). Один остаток, может быть, аннотирован более одного раза из-за некоторых перекрытий в областях, аннотированных в двух источниках.
  3. Используйте поле выравнивания multiple protein для того чтобы получить аминокислоту множественные выравнивание произведенных DIOPT9 которое вклюает людск (hs), крыса (rn), мышь (mm), zebrafish (dr), муха плодоовощ (dm), червь (ce), и дрожжи (sc и sp). Чтобы подчеркнуть аминокислоты интерес, прокрутите вниз к нижней части коробки и ввести аминокислоты номера ниже и аминокислоты, представляющие интерес будут выделены в чирок. Выравнивание обеспечивается DIOPT и использует выравниватель MAFFT (Программа множественных выравниваний для аминокислотных или нуклеотидных последовательностей, https://mafft.cbrc.jp/alignment/software/31).
    ПРИМЕЧАНИЕ: Если аминокислота, которая выделяется на основе числа не ожидается, это может быть связано с различными сплайсинг изоформ, используемых для выравнивания. В принципе, DIOPT использует самую длинную изоформу для отображения в этой коробке. Кроме того, для сегментов генов, которые не хорошо сохраняются, выравнивание многовидовых последовательностей с использованием параметров по умолчанию может быть неоптимальным. Мы рекомендуем использовать другие веб-сайты и программное обеспечение, такие как Clustal Omega и ClustalW/X (http://www.clustal.org/)32 для оптимизации параметров выравнивания и матриц соответственно.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Генетики человека и модельные ученые используют MARRVEL по-разному, каждый с различными желаемыми результатами. Ниже приведены три виньетки возможного использования для MARRVEL.

Оценка патогенности варианта доминирующего заболевания
Большинство пользователей, посещающих MARRVEL, используют этот веб-сайт для анализа вероятности того, что редкий человеческий вариант может вызвать определенное заболевание. Например, было установлено, что в аутосомно-доминантном режиме в небольшой семье с дисморфическими особенностями и расщелиной неба, сердечными дефектами, скелетными и цифровыми аномалиями был сегрегирован вариант неправильного отношения в аутосомно-доминантном режиме в небольшой семье с дисморфическими свойствами и расщелиной неба, сердечными дефектами, скелетными и цифровыми аномалиями, связанными с щитовидной железой фенотипы, и иммунные дефекты12. Мать и 2 детей affected с этими симптомами снесли вариант, тогда как отец не сделал. У 9-летнего сына был самый тяжелый фенотип, в то время как у 36-летней матери и 6-летней дочери были более мягкие формы этого заболевания. Чтобы оценить, является ли этот вариант вероятным патогенным, можно начать поиск MARRVEL, введя ген и варианты на стартовой странице http://MARRVEL.org. Обратите внимание, что вариант поиска бар требует удаления Chr перед вариантом, если это перечислено в первоначальном клиническом отчете, чтобы указать "Хромосома". Во время первоначально изучения, страница результатов показала что никакой phenotype OMIM связанный с этим геном, и этот вариант найден только разв gnomAD но не в ExAC, ClinVar, или Mp Geno 2. Можно подумать, что это определение одного человека может быть доказательством против p.R20 "является патогенным вариантом, но важно отметить, что мать семьи выставлены мягкой форме заболевания. Вариант, найденный в 1 / 150 000 человек действительно очень редкий вариант и идентификации человека с идентичным вариантом может быть объяснено снижение выразительности или penetrance. В таблице функции гена часто полезно проверить, выражается ли ген в соответствующих тканях человека (через GTEx и Protein Atlas) по отношению к фенотипам пациента. В этом случае, модель выражения совпадает, так как пациент имеет фенотипы в нескольких тканях и ген также широко выражен, в том числе сердечных и иммунных органов.

Основываясь на информации о модельном организме, отображаемой в MARRVEL, можно быстро увидеть, что ген сохраняется от C. elegans и Drosophila к человеку и аминокислоты интереса, p.R20 также высоко сохраняется на протяжении всей эволюции, как показано в Рисунок 2 (обратите внимание, что крыса Tbx2 не выравнивается хорошо в этом регионе, вероятно, из-за стенограммы, которая используется для выравнивания). Фенотипическая информация в мыши и зебры указывает на то, что этот ген влияет на развитие или функцию ряда тканей, включая сердечно-сосудистую систему, краниофациальный / palate, и цифры. В целом, эти данные свидетельствуют о том, что этот вариант, возможно, патогенный и дальнейшее функциональное исследование является ценным. Учитывая, что ген и вариант сохраняются в организмах, как C. elegans и Drosophila, функциональные исследования у беспозвоночных животных будет быстрее и дешевле по сравнению с выполнением того же эксперимента в позвоночных модели организмов таких как зебрафиш, мышь и крыса. Пожалуйста, смотрите сопроводительную статью Harnish et al.21 о том, как мы разработали и выполнили функциональные анализы для этого случая12. Участие этого гена/варианта в болезни этой семьи было еще более усилено путем идентификации неродственного 8-летнего пациента мужского пола с перекрывающимися фенотипами с вариантом de novo missense в том же гене, использующего GeneMatcher. Варианты в двух семействах были признаны функциональными с помощью экспериментов в Drosophila, дальнейшее поддержание патогенности редких вариантов в TBX2. Болезнь недавно была куратором как "Позвоночные аномалии и переменной эндокринной и Т-клеточной дисфункции (VETD, OMIM #618223)" в OMIM. См Рисунок 3 для всего вывода для TBX2 17:59477596 ГЗТ;

Оценка патогенности варианта рецессивного заболевания
Существуют значительные различия между анализом человеческих вариантов в доминирующих и рецессивных заболеваний. Например, оценка pLI, незначительная частота аллелей и наличие удаления в контрольной популяции становятся менее важными, потому что два аллеля необходимы для выявления любого фенотипа.

Один из примеров анализа рецессивной болезни подробно описан в Yoon et al33 и Wang et al 4, которые кратко изложены здесь. 15-летняя девочка продемонстрировала задержку развития, микроцефалию, атаксию, двигательные нарушения, гипотонию, языковые нарушения, аномалии мозга и гипоплазию мозоли33. Proband, ее незатронутые родители, и незатронутый брат получил WES. После фильтрации вариантов, которые были уникальными для пробандии и редки в популяции, остались варианты в 13 различных генах. Ручная фильтрация и анализ 13 кандидатов путем выполнения описанного здесь протокола привели к тому, что один конкретный вариант в OGDHL стал хорошим кандидатом для функциональных исследований. Ключевые части информации, которые привели к приоритетам p.S778L в OGDHL (10:50946295 ГЗТТ; А) по сравнению с другими вариантами включают в себя: (1) нет предыдущей ассоциации болезни в OMIM, (2) вариант не найден в контрольных популяций, (3) гена онтологии, связанные с microtubule и митохондрии, две системы, которые имеют много связей с неврологическими расстройствами34,35, (4) высоко выражены в мозжечок человека, ткани серьезно пострадавших в этом пациенте, и (5) вариант интереса, влияющих на весьма сохраняется аминокислота (от дрожжей до человека) и находится в каталитической области4. оценка pLI для этого гена 0.00 но это не влияет на приоритетность этого варианта/гена для этого случая в виду того что мы заподозрив рецессивный режим унаследования и что носители вредных вариантов в этом гене могут представить в вообще населенности. См. Рисунок 4 для выхода MARRVEL для OGDHL 10:50946295 ГЗТ;А.

Модельные исследования организма, проведенные параллельно показали, что потеря Ogdh(также называемый Nc73EF), Ортолог Дрозофилы OGDHL, в нервной системе экспонатов нейродегенеративного фенотипа в соответствии с неврологическое расстройство proband33. Функциональные исследования в Дрозофиле показали, что вариант интереса (p.S778L) влияет на функцию белка, что делает это сильным геном кандидата на это заболевание. С тех пор эта информация о потенциальном патогенном варианте в OGDHL, связанном с новым неврологическим расстройством, была включена в OMIM (https://www.omim.org/entry/617513) совсем недавно, но еще не была назначена болезнь-фенотип число, поскольку только один случай был зарегистрирован по состоянию на январь 2019 года.

Связан ли человеческий ортолог модельного гена организма, представляющий интерес для генетических заболеваний?
Многие исследователи модельного организма могут быть заинтересованы, чтобы увидеть, является ли человеческий ортог их гена интереса может иметь связь с генетическими заболеваниями. В этом примере мы будем искать, имеет ли человеческий ортологи (ы) гена fly Notch (N) какое-либо отношение к генетическим заболеваниям. Для этого мы начнем с выполнения "МодельНые организмы Поиск (1.3.1.-1.3.2.)" и выберем"Drosophila melanogaster" в качестве названия вида и"N" в качестве названия гена гена модели. Четыре предсказанных ортолота для этого гена мухи будут отображаться в окне результатов как NOTCH1, NOTCH2, NOTCH3 и NOTCH4. Четыре гена имеют различные оценки DIOPT (10/12 для NOTCH1, 8/12 для NOTCH2 и NOTCH3, 5/12 для NOTCH4) из-за степени гомологии между мухой N и каждым человеческим геном. Учитывая "Лучший балл от гена человека летать" перечислены как "Да" для всех четырех генов, обратный поиск от каждого человеческого гена поднимает летать N гена в качестве наиболее вероятного кандидата ортодокса. Действительно, четыре человека NOTCH генов, как полагают, возникли из одного гена Notch в течение двух раундов всего генома дублирования событий, которые произошли в позвоночных линии после расщепления от беспозвоночных линии36. Нажав кнопки "MARRVEL it" для каждого гена человека, можно получить выводы генов человека для NOTCH1-4.  На странице результатов каждого гена, верхние коробки для OMIM показывают, что в то время как NOTCH1, 2 и 3 связаны с генетическими заболеваниями, NOTCH4 в настоящее время не связанс с любыми заболеваниями человека. Обратите внимание, что были дебаты о том, варианты в NOTCH4 связаны с шизофренией на основе генома всей ассоциации исследований (GWAS)37,38. Поскольку OMIM обычно не курирует данные GWAS с некоторыми исключениями (например, APOE, PTPN22),эта информация недоступна из окна OMIM. Аналогичным образом, поскольку OMIM обычно не курирует связанную с раком соматическую мутацию информацию, информация о том, связаны ли соматические мутации в этих генах с определенными типами рака, не будет перечислена за некоторыми исключениями (например, TP53, RB1, BRCA1). Нажав на поле PubMed или Monarch, можно определить некоторые связанные с болезнью документы, которые не курируются в OMIM. Смотрите Рисунок 5 для всего выхода MARRVEL для гена мухи N и человеческого гена NOTCH4.

Figure 1
Рисунок 1 . Вывод представителя из поиска MARRVEL. Этот конкретный пример показывает ген / вариант поиска "TBX2/17:59477596 ГЗТ;А" (http://marrvel.org/search/pair/TBX2/17:59477596%20G%3EA). Боковая панель слева поддерживает навигацию через выход данных. Обратите внимание, что знаки "внешняя ссылка" здесь предоставляют ссылки на соответствующие страницы браузера генома UCSC (https://genome.ucsc.edu/). Вкладки сверху позволяют выполнять генные поиски модельного организма, получать дополнительную информацию о MARRVEL и обеспечивать обратную связь с пользователями. Панели «Результаты поиска» отображают информацию о генах и вариантах из источников, указанных на изображении. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Figure 2
Рисунок 2 . Резюме модели таблицы орфогного организма и многовидового выравнивания для TBX2. A) MARRVEL выбирает главного ортолога-кандидата для каждого вида на основе инструмента DIOPT. Например, DIOPT оценка 10/12 показано для гена Drosophila би означает 10 из 12 программ прогнозирования ортологии, используемых DIOPT предсказал, что би является наиболее вероятной летать ортологии человека TBX2. Поскольку 25% генов дублируются в зебрафиш по сравнению с человеком, MARRVEL отображает два паралоговых генов (в данном случае tbx2a и tbx2b), когда это применимо. B) Снимок многовидового окна выравнивания. Выбрав конкретный организм (в данном случае человека (hs)) и введя аминокислоту, интересующую его, можно выделить специфическую аминокислоту в чирок. В этом примере, p.R20 человека TBX2, кажется, сохраняется в мыши (mm1), как ортолологи зебры (dr1 и dr2), Drosophila (dm1) и C. elegans (ce1). Крыса Tbx2, кажется, не выровнять хорошо по сравнению с другими видами, скорее всего, из-за изоформы, используемой DIOPT для выполнения многовидового выравнивания. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Figure 3
Рисунок 3 : Весь выход для TBX2 17:59477596 ГЗТ;А. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Figure 4
Рисунок 4 : Выход MARRVEL для OGDHL 10:50946295 ГЗТ;А. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Figure 5
Рисунок 5 : выход MARRVEL для гена мухи N и человеческого гена NOTCH4. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Тип базы данных Название базы данных URL/Ссылка на базу данных Обоснование для включения в MARRVEL Справочник (PMID)
Генетика человека КлинВар https://www.ncbi.nlm.nih.gov/clinvar/ ClinVar является публичным архивом докладов о взаимосвязи между человеческими вариациями и фенотипами, с подтверждающими доказательствами. Варианты с интерпретациями, представленными исследователями и клиницистами, ценны для анализа вероятности патогенного варианта. PMID: 29165669
Генетика человека Расшифровать https://decipher.sanger.ac.uk/ Данные DECIPHER, отображаемые на MARRVEL, включают общие варианты из контрольной популяции. Отображаемые данные включают структурные варианты, которые охватывают геномное расположение варианта ввода. DECIPHER также содержит вариант и фенотипическую информацию для пострадавших лиц, но можно получить доступ только непосредственно через их веб-сайт. PMID: 19344873
Генетика человека DGV http://dgv.tcag.ca/dgv/app/home Насколько нам известно, DGV является крупнейшим общественным доступом коллекция структурных вариантов из более чем 54000 человек. База данных включает образцы, как сообщается, здоровых людей, на момент установления, от до 72 различных исследований. Возможные ограничения этих данных включают изменение источника и метода полученных данных, отсутствие информации о неполном пенетрансе патогенных CNV и о том, будут ли у отдельных лиц развиваться связанные с ними заболевания после сбора данных. PMID: 24174537
Прогноз ортологии ДИОПТ https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl DIOPT обеспечило множественные выравнивания последовательности протеина самых лучших предсказанных orthologs в 6 модельных организмах против последовательности протеина людского гена интереса. Выравнивание обеспечит информацию о сохранении специфических аминокислот, а также функциональных белковых доменов. PMID: 21880147
Человеческий ген/Стенограмма номенклатуры Энсембл https://useast.ensembl.org/ Идентиповные идентизаны генов Ensembl используются для связи различных баз данных. PMID: 29155950
Генетика человека ExAC http://exac.broadinstitute.org/ ExAC содержит более 60000 экзомов и, кроме gnomAD (http://gnomad.broadinstitute.org/), крупнейшая публичная коллекция экзомов, которые были выбраны в отношении лиц с тяжелыми раннего начала мендельских фенотипов. Для целей MARRVEL, ExAC и gnomAD служит лучшим набором данных для управления популяционными данными для расчета незначительной частоты аллелей. Мы предоставляем два набора выходов от ExAC. Первый выход представляет собой генно-ориентированный обзор ожидаемого и наблюдаемого количества несомненность и потери функции (LOF) аллелей. Метрика, называемая pLI (вероятность непереносимости LOF) колеблется от 0,00 до 1,00, отражает селективное давление на определенные варианты до репродуктивного возраста. pLI оценка 1,00 означает, что этот ген очень нетерпимк любых вариантов LOF и гаплоиносцификции этого гена может вызвать болезнь у человека. Второй вывод — это данные ExAC, относящиеся к конкретному варианту. Если идентичный вариант виден в ExAC, MARRVEL будет отображать незначительную частоту аллелей. PMID: 27535533
Базы данных первичных типов FlyBase (Дрософила) http://flybase.org MARRVEL собирает и отображает данные из нескольких баз данных типов. Мы предоставляем резюме молекулярной, клеточной и биологической функции гена с использованием терминов GO. Наиболее вероятная орфога получена DIOPT. PMID:26467478
Инструменты интеграции базы данных для баз данных модели Gene2Function http://www.gene2function.org/search/ MARRVEL сотрудничает с DIOPT и Gene2Function, чтобы предоставить функцию «Поиск модельных организмов». Hyperlink предоставляется пользователям для доступа к их веб-сайт, который интегрирует ряд баз данных MO и отображает их в другом стиле от того, как MARREL делает. PMID: 28663344
Генетика человека Geno2MP http://geno2mp.gs.washington.edu/Geno2MP/ Geno2MP представляет собой коллекцию образцов из Университета Вашингтона Центр менделей генетики. Он содержит 9 650 экзомов пострадавших лиц и незатронутых родственников. Эта база данных связывает фенотипическую информацию, а также режим наследования информацию с конкретными аллелями. Для фенотипа, сравнивая пораженную систему органов пациента, интересуемого с пострадавшими лицами в Geno2MP, можно найти потенциальные совпадения. Совпадение в аллеле, режиме наследования и фенотипе обеспечивает повышенную вероятность того, что вариант вероятно патогенный. Однако из-за небольшого размера выборки отрицательная ассоциация не обязательно уменьшает патогенный приоритет варианта. В первоначальном источнике предусмотрен механизм обращения к основному врачу интересуемого пациента. N/A
Генетика человека гномАД http://gnomad.broadinstitute.org/ gnomAd содержит в общей сложности 123 136 экзомических последовательностей и 15 496 последовательностей всего генома от неродственных людей, секвенированных в рамках различных генетических исследований, связанных с конкретными болезнями и популяциями. Значительная часть данных ExAC интергергируется в gnomAD. В MARRVEL в настоящее время отображаются частоты популяций, относящиеся к конкретному варианту. PMID: 27535533
Ген Онтология GO Центральный http://www.geneontology.org/ MARRVEL отображает только генонологии (GO) термины (молекулярная функция, клеточный компонент, и биологический процесс), полученных из экспериментальных доказательств для каждого гена. Они фильтруются с помощью "экспериментальных кодов доказательств" и терминов GO, основанных на "кодах доказательств вычислительного анализа" и "электронных кодах доказательств аннотации" (прогнозы) избегаются. PMID: 10802651, 25428369
Выражение гена/белка человека GTEx https://gtexportal.org/home/ MARRVEL отображает как мРНК, так и модель экспрессии белка в тканях человека каждого гена. Шаблон выражения может добавить понимание фенотипов, наблюдаемых у пациентов и/или модельных организмов. PMID: 29019975, 23715323
Номенклатура гена человека HGNC https://www.genenames.org/ Для поиска MARRVEL используются официальные символы гена HGNC. PMID: 27799471
Базы данных первичных типов IMPC (мышь) http://www.mousephenotype.org/ MARRVEL предоставляет гиперссылку на страницы гена мыши на веб-сайте IMPC. Если была выбивая мышь, сделанная IMPC, исчерпывающий список анализов и их результаты становятся доступными публично и может обеспечить понимание фенотипа, когда ген теряется. Некоторая информация кураторва в MGI но возможно запаздывание времени. PMID: 27626380
Базы данных первичных типов MGI (мышь) http://www.informatics.jax.org/ MARRVEL собирает и отображает данные из нескольких баз данных типов. Мы предоставляем резюме молекулярной, клеточной и биологической функции гена с использованием терминов GO. Наиболее вероятная орфога получена DIOPT. PMID:25348401
Инструменты интеграции базы данных для баз данных модели Монархическая инициатива https://monarchinitiative.org/ MARRVEL предоставляет ссылку на Феногрид человеческого гена на Монарх инициативы. Эта сетка обеспечивает сравнение между фенотипом модельных организмов и известными болезнями человека. PMID: 27899636
Номенклатура человека Вариант Мутализер https://mutalyzer.nl/ MARRVEL использует API Mutalyzer для преобразования номенклатуры различных вариантов в геномное расположение. PMID: 18000842
Генетика человека ОМИМ https://omim.org/ Три основные части информации, которые мы черпаем из OMIM являются: функция гена, связанные фенотипы, и сообщил аллелей. Полезно знать, связан ли ген с известным мендельским фенотипом (записи), молекулярная основа которого известна. Гены без этого знания будут выбранными для нового открытия гена. Для генов, которые являются этой категории, если фенотип пациента не соответствует зарегистрированной болезни и фенотипа, а также пациентов в литературе, то это увеличивает возможность обеспечить фенотипическое расширение гена интереса. PMID: 28654725
Базы данных первичных типов PomBase (расщепление дрожжей) https://www.pombase.org/ MARRVEL собирает и отображает данные из нескольких баз данных типов. Мы предоставляем резюме молекулярной, клеточной и биологической функции гена с использованием терминов GO. Наиболее вероятная орфога получена DIOPT. PMID:22039153
Литературы Pubmed https://www.ncbi.nlm.nih.gov/pubmed/ MARRVEL обеспечивает гиперссылку на "Джин" на основе поиска PubMed. Нажав на эту ссылку позволит искать биомедицинских работ, что относится к гену интереса на основе предыдущих имен генов и символов. N/A
Базы данных первичных типов RGD (крыса) https://rgd.mcw.edu/ MARRVEL собирает и отображает данные из нескольких баз данных типов. Мы предоставляем резюме молекулярной, клеточной и биологической функции гена с использованием терминов GO. Наиболее вероятная орфога получена DIOPT. PMID:25355511
Базы данных первичных типов SGD (подающий надежды дрожжи) https://www.yeastgenome.org/ MARRVEL собирает и отображает данные из нескольких баз данных типов. Мы предоставляем резюме молекулярной, клеточной и биологической функции гена с использованием терминов GO. Наиболее вероятная орфога получена DIOPT. PMID: 22110037
Выражение гена/белка человека Атлас человеческого белка https://www.proteinatlas.org/ MARRVEL отображает как мРНК, так и модель экспрессии белка в тканях человека каждого гена. Шаблон выражения может добавить понимание фенотипов, наблюдаемых у пациентов и/или модельных организмов. PMID: 21752111
Базы данных первичных типов WormBase (C. elegans) http://wormbase.org MARRVEL собирает и отображает данные из нескольких баз данных типов. Мы предоставляем резюме молекулярной, клеточной и биологической функции гена с использованием терминов GO. Наиболее вероятная орфога получена DIOPT. PMID:26578572
Базы данных первичных типов «ФИН» (зебрафиш) https://zfin.org/ MARRVEL собирает и отображает данные из нескольких баз данных типов. Мы предоставляем резюме молекулярной, клеточной и биологической функции гена с использованием терминов GO. Наиболее вероятная орфога получена DIOPT. PMID:26097180

Таблица 1. Список источников данных для MARRVEL. Все базы данных, из которых MARRVEL получает данные, перечислены в этой таблице. Для каждой базы данных мы перечисляем тип базы данных, URL/Link, обоснование включения в MARRVEL и первичные ссылки.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Критические шаги в этом протоколе включают начальный вход (шаги 1.1-1.3) и последующее толкование вывода. Наиболее распространенной причиной, почему результаты поиска являются отрицательными из-за многих способов, что ген и / или вариант может быть описана. Хотя MARRVEL обновляется на плановой основе, эти обновления могут привести к разрыву между различными базами данных, на которые ссылается MARRVEL. Таким образом, первым шагом в устранении неполадок неизменно проверяется, приведут ли альтернативные названия гена или варианта к успешному результату поиска. Если она все еще не может быть решена, пожалуйста, отправьте сообщение группе разработчиков, используя форму обратной связи в http://marrvel.org/message.

Одним из ограничений MARRVEL является то, что он еще не включает в себя все полезные базы данных, необходимые для генного и вариантного анализа. Например, алгоритмы прогнозирования патогенности, такие как CADD18, в настоящее время не предоставляются. Аналогичным образом, информация о структурной структуре белка и информация о взаимодействии белка и белка, которые могут также обеспечивать структурные и функциональные связи с известными вызывающими болезни вариантами в генах, в настоящее время не отображаются в MARRVEL. В нашем следующем крупном обновлении, мы планируем интегрировать эту информацию в MARRVEL, в дополнение к включению более фенотипической информации из моделей веб-сайтов организма, IMPC, Monarch инициативы и Альянса геномных ресурсов (AGR, https://www.alliancegenome.org/). Поскольку MARRVEL был разработан для облегчения исследований редких заболеваний, программа в настоящее время фокусируется на зародышевых вариантах и не предоставляет доступ к информации о соматическом варианте. На момент публикации этого протокола не интегрированы базы данных, связанные с генетикой рака. Поскольку MARRVEL активно развивается и обновляется, мы высоко ценим обратную связь и настоятельно рекомендуем существующим пользователям подписаться на информационные бюллетени по http://marrvel.org/message для любых будущих дополнительных баз данных, которые становятся интегрированными.

Хотя данные MARRVEL могут быть использованы для определения приоритетов вариантов, которые могут быть патогенными. Однако, для того, чтобы продемонстрировать патогенность, нужно будет определить других пациентов с аналогичными генотипами и фенотипами или выполнить функциональные исследования, чтобы обеспечить убедительные доказательства того, что вариант интереса имеет функциональные последствия, которые имеют отношение к состояние болезни. Для получения дополнительной информации о дополнительной информации за пределами MARRVEL, которые могут быть полезны, чтобы судить, если вариант стоит экспериментального изучения в модели организма, пожалуйста, обратитесь к сопроводительной статье Harnish et al21. Для того, чтобы сделать следующие шаги в использовании модельных организмов для изучения человеческих вариантов, генетики человека и исследователи модельного организма должны быть в состоянии подключиться и сотрудничать. GeneMatcher и другие геномные консорциумы, которые являются частью консорциума Matchmaker Exchange являются ресурсами, которые облегчают этот следующий шаг. Если пользователи проживают в Канаде, можно также зарегистрироваться в сети моделей и механизмов редких заболеваний (RDMM, http://www.rare-diseases-catalyst-network.ca/) для выявления клиницистов и/или исследователей модельного организма, которые готовы сотрудничать39 . Япония (J-RDMM, https://irudbeyond.nig.ac.jp/en/index.html), Европа (RDMM-Европа, http://solve-rd.eu/rdmm-europe/) и Австралия (Австралийская сеть функциональной геномики: https://www.functionalgenomics.org.au/) недавно приняли Канадская модель RDMM для облегчения аналогичного сотрудничества в своих странах/регионах. Кроме того, с помощью таких инструментов, как BioLitMine (https://www.flyrnai.org/tools/biolitmine/web/) можно искать потенциальных сотрудников среди главных исследователей, которые ранее работали над геном интереса.

Наконец, в дополнение к MARRVEL, Есть ряд других кросс-видов инструментов для интеллектуального анализа данных, включая Gene2Function40 (http://www.gene2function.org/), Monarch Initiative29 (https://monarchinitiative.org/) и Альянс Ресурсы генома (AGR, https://www.alliancegenome.org/). В то время как Gene2Function предоставляет доступ к межвидовым данным, а Monarch Initiative предоставляет фенотипические сравнения, MARRVEL уделяет больше внимания человеческим вариантам и увязке геномных данных человека с модельными организмами. AGR является инициативой, которая включает в себя шесть типовых баз данных организмов и консорциум генов онтологии, который объединяет данные из различных баз данных в единый способ для повышения доступности данных, накопленных каждой базой данных. Эти ресурсы дополняют друг друга, и пользователи должны понимать сильные стороны каждой базы данных, чтобы ориентироваться в огромном объеме знаний, накопленных исследователями в общинах. По мере продолжения разработки MARRVEL мы планируем включить больше баз данных, имеющих отношение к изучению человеческих вариантов в модельных организмах. Общей целью MARRVEL является предоставление легкодоступного способа для клиницистов и исследователей, так для анализа человеческих генов и вариантов для дальнейшего изучения путем интеграции полезной информации, сохраняя при этом интерфейс так просто, как мы можем.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторам нечего раскрывать.

Acknowledgments

Мы благодарим д-ра Рами Аль-Оран, Сон-Янг Ким, Яньхуэй (Клер) Ху, Ин-Вуи Ван, Навин Манохаран, Сасидхар Пасупулети, Арам Комжан, Донксуэ Мао, Майкл Ванглер, Сяо-Туан Чао, Стефани Мор и Норберт Перримон техническое обслуживание MARRVEL. Мы признательны Саманте Л. Дил и Дж.Майклу Харнишу за их вклад в эту рукопись.

Первоначальная разработка MARRVEL была частично поддержана Центром скрининга модели недиагностированных болезней сети через NIH Commonfund (U54NS093793) и через NiH Office программ исследовательской инфраструктуры (ORIP) (R24OD022005). JW поддерживается NIH Eunice Кеннеди Шрайвер Национальный институт здоровья детей и развития человека (F30HD094503) и Роберт и Дженис Макнейр Фонд McNair MD / PhD Студенческая стипендиат программы в BCM. HJB также поддерживается Национальным институтом общих медицинских наук NIH (R01GM067858) и является исследователем Медицинского института Говарда Хьюза. ЗЛ поддерживается Национальным институтом общей медицинской науки NIH (R01GM120033), Национальным институтом старения (R01AG057339) и Фондом Хаффингтона. SY получил дополнительную поддержку от Национального института NIH по глухоты и других расстройств связи (R01DC014932), Фонд Симонса (SFARI Премии: 368479), Ассоциация Альцгеймера (Новый исследователь исследований Грант: 15-364099), Наман семьи Фонд фундаментальных исследований и Кэролайн Висс Юридический фонд для исследований в области молекулярной медицины.

Materials

Name Company Catalog Number Comments
Human Genetics ClinVar PMID: 29165669 https://www.ncbi.nlm.nih.gov/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www.ncbi.nlm.nih.gov/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, Database issue 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, Pt 3 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), Bethesda. 2855-2858 (2017).

Tags

Генетика Выпуск 150 Геномика человека вариант приоритетов модель организмов генетика редкие и недиагностированные заболевания функциональная геномика интеграция баз данных трансляционные исследования медицинская диагностика вариант неизвестного значения ген неопределенное значение веб-инструмент
Навигация MARRVEL, веб-инструмент, который интегрирует геномику человека и модель генетики организма информации
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wang, J., Liu, Z., Bellen, H. J.,More

Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter