$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Графическое изображение, подчеркнув, в которой применяется стадии рабочего процесса регулярных proteomic ПОГО18 , а также ниже по течению параметры визуализации, показан на рисунке 5. Ружье протеомики (то есть, протеолитических переваривание белков, следуют жидкостной хроматографии в сочетании с тандем масс-спектрометрия) является один шаг коляска proteogenomic сопоставления. Результате массового спектры тандем обычно сравниваются с Теоретические спектры, производные от баз данных последовательности белка. Протеогеномики исследования ввести перевод последовательности Роман стенограммы с кодирования потенциал и не являются синонимами единичных нуклеотидных варианты (SNVs) в базу данных, что делает его трудно соотнести эти обратно в геном ссылка8. Графический интерфейс пользователя ПОГО (PoGoGUI) поддерживает форматы файлов для стандартизированной отчетности пептид идентификации от масс-спектрометрии экспериментов и преобразует их в формат упрощенной 4-колонки pogo. PoGoGUI служит оболочкой для программы командной строки ПОГО и таким образом позволяет отображение пептидов на геном координаты, используя ссылку аннотации белка кодирование генов, обычно предусмотрено в ГЦФ и последовательности переведенный текст в формате FASTA. Различных форматах генерируются PoGo возможность визуализации различных аспектов пептиды, выявленных с помощью масс-спектрометрии, в том числе столб-поступательные изменения и пептида уровня количественная оценка. Выходные файлы в постели можно далее преобразуется и объединены в онлайн доступны каталоги, называется трек концентраторы. Один выходные файлы, а также трек концентраторы, затем могут быть визуализированы в браузерах, таких как браузер геноме UCSC25, Ensembl генома браузер20, IGV24и Biodalliance28 (см. Нижний Рисунок 5 ).
Мы применили PoGo к реанализа проект протеома человека карты фильтруют на большое значение, как описано в Райт и др. 7 и сравнил его с двух других инструментов для proteogenomic карт, а именно группе14 и PGx10. Набор данных состоит из 233,055 уникальный пептиды через 59 взрослых и плода ткани, что приводит к в общей сложности более 3 миллионов последовательностями. Пого превысили эти инструменты в среде выполнения (6,9 x и 96,4 x быстрее, соответственно) и использование памяти (20% и 60% меньше памяти, соответственно) как показано на рисунке 618. На рисунке 7приведен пример успешно сопоставленным пептида.
В то время как пого значительно превосходит другие инструменты в скорости и памяти, он также способен столб-поступательные изменения сопоставления и количественной информации, связанной с пептидами на геном. Рис. 8А схематически изображает визуализации кровати формата в браузере генома для пептидов, сопоставление один Экзон и через сращивания развязок. Пого использует вариант раскраски для предоставления легко визуальная отношении уникальность пептид картирования в геноме. Сопоставления в красном указывают неповторимость единого стенограмма, а черные моменты сопоставление одного гена. Однако пептид распределяется между различными стенограмм. Серый сопоставления показывают пептид совместно между несколькими генами. Таковы, например, менее надежной количественной оценки гена или ненадежным для вызова выражения гена. PTM кровать вариант PoGo переопределяет цветовой код для размещения различных типов столб-поступательные изменения, как показано на Рисунок 8B. Кроме того PTMs обозначаются блоков толщиной (см. Рисунок 8B). Один PTM типа выделен блок толщиной в позиции модифицированных аминокислотных остатков, в то время как несколько PTMs того же типа занимаемых толщиной блока от первых модифицированных амино кислоты до последнего.
Мы применили ПОГО и впоследствии TrackHubGenerator в набор 50 колоректальный рак клеточных линий, включая весь протеома и phosphoproteome29. Хотя трек хаб, загруженной в браузере геноме UCSC показывает пептиды, сопоставляются с геном и подчеркивает уникальность сопоставления и фосфорилирование сайты (см. рис. 9), дополнительные данные предоставляются дополнительные папки. GCT файлы затем включите визуализации пептида и phosphopeptide количественный в геномной контексте. Однако файлы GCT не обеспечивают простой визуализации пептидов, охватывающих через соединитель развязок (см. рис. 10 Топ). Пептиды через соединитель развязок разделены на их соответствующих частей сопоставления экзонов. Хотя это можно определить соединитель пептиды через те же количественные значения экзона сопоставлений, загрузки сопоставлений на основе последовательности файлов например, кровать или GTF, подключите экзонов, тонкий Интрон, охватывающих линию поддержки толкования (см. Рисунок 10 внизу).
Чтобы подчеркнуть полезность вариант включено сопоставление, мы применили ПОГО в двух конфигурациях для dataset протеома человека яичек, Поиск против neXtProt охотиться за отсутствующих белков, с использованием нескольких ферментных стратегии22. NeXtProt включает в себя помимо ссылки белковых последовательностей более 5 миллионов одной аминокислоты варианты30. Сопоставление пептиды, отождествляется с одной аминокислоты вариант не поддерживается другими средствами отображения. В общей сложности 177,012 уникальный пептиды были определены. Из них пептиды 99,8% (176,694) были впервые успешно сопоставлены не позволяя несоответствия. Удаление из списка выявленных пептид привели к 0,2% (318) пептидов, которые впоследствии были сопоставленных позволяя одной аминокислоты замены. Это привело к 3.446 сопоставления 162 пептидов, которые не были сопоставлены с геном ссылки с других доступных инструментов. В то время как среднее количество сопоставлений, включая несоответствие является высоким, 62 пептиды были сопоставлены только один локус, указывающее истинный вариант последовательности. Пример пептида, сопоставленных с одной аминокислоты замены выделяется с его последовательности и переведенного геномные последовательности на рисунке 11.

Рисунок 1. Визуальное сравнение инструментов различных пептид геном картографирования. Что касается различных аспектов показано сравнение. Эти аспекты включают в себя ссылку на сопоставление, уровень интеграции в рамки и поддержку онлайн и оффлайн браузеры. Кроме того новые аспекты Протеогеномики и их функция поддержки выделяется отдельно. Пого не хватает только возможность непосредственно сопоставляются генома, по сравнению с другими инструментами. Однако он поддерживает все новых функций, которые не поддерживают большинство других инструментов. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 2. Пример ввода файла для сопоставления пептиды. Пого принимает входные данные в формате табуляцией с 4 колонками. Заголовки столбцов в первой строке являются «Эксперимент», «Пептид», «PSMs» и «Квант», указывающий в следующих строках эксперимент или образец идентификатора, последовательность пептид, количество матчей пептид спектра и количественное значение для пептида, соответственно. Поддерживаемые расширения имен файлов *.txt, *.tsv и *.pogo. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 3. PoGoGUI интерфейс с выделенных шагов для выбора файлов и настройки параметров. На рисунке показаны шаги для выбора и загрузки всех необходимых файлов и выбор вариантов для сопоставления пептиды с столб-поступательные изменения на геном человека ссылки. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 4. Скриншот интегративной геномики просмотра (IGV) данных добавлено процедуры. Фигура освещает шаги, необходимые для загрузки ПОГО выходных файлов в браузере IGV. Кроме того он показывает параметр расширения трек сопоставленных пептиды, чтобы выделить картирования и последовательности. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 5. Упрощенный процесс визуализации в геном браузеров в нескольких шагах от LC-MS/MS. Пого сопоставления следует идентификация пептидов из массы спектры тандем. Для достижения картирования генома, ПОГО использует ссылку аннотации, как Аннотация геномов (ГЦФ) и Стенограмма перевод последовательности (FASTA). Различные форматы создаются вывода, который может быть загружен отдельно в геном браузеров. Кроме того файлы в формате кровати могут быть объединены в трек центров поддержки визуализации крупных наборов данных. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 6. Бенчмаркинг ПОГО против PGx и группе. Пого превосходит другие инструменты на бенчмаркинг. Картирование 233,055 уникальный пептиды через 59 взрослых и плода ткани, что приводит к более 3 миллионов последовательностями, ПОГО была 6,9 x и 96,4 x быстрее, чем PGx и группе, соответственно. Кроме того ПОГО требуется 20% и 60% меньше памяти по сравнению с PGx и группе, соответственно. В то время как пого и PGx завершился успешно, группе привели к ошибка памяти в 16 ГБ. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 7. Геноме UCSC браузера пример представления сопоставленных пептидов. На рисунке показана пептиды, сопоставляются mTOR ген. В то время как комбинированные трек показывает пептиды, охватывающих через соединитель развязок и сопоставления только один Экзон с связанные последовательности, ткани конкретные треки только выделить сопоставление в сжатый формат. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 8. Схема сопоставления визуализации и цветовое кодирование. (A) в файле вывода стандартной кроватью, пептиды, сопоставление экзона отображаются в виде единого блока (слева), в то время как пептиды, сопоставление через несколько экзонов голы экзона, охватывающих частей как блоки (справа). Интронов показываются тонкие линии объединения. Пого цвет-коды уникальность сопоставления или пептиды генов, и стенограммы с использованием 3-уровневой системы. (B) помимо блочную структуру формата кровати, кровать PTM вывода подчеркивает позицию столб-поступательные изменения блоков толщиной. Наличие единого PTM типа подчеркивает изменение аминокислотных остатков с толщиной блока, в то время как несколько сайтов же PTM объединяются в длинные блоки, охватывающих от первой до последней модификации сайта. Пептид сопоставлений далее разделены PTM тип и цвет кодека на основе модификации. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 9. Отслеживать хаб Просмотр в браузере геноме UCSC колоректального рака протеома и phosphoproteome данных. Трек концентратора включает в себя весь протеома данных, а также phosphoproteome. В то время как красный цвет в протеома и phosphoproteome треков указывают уникальность сопоставление одного запись SFN, треки, заканчивающийся в _ptm Показать сайты фосфорилирования внутри пептиды. Здесь красный цвет указывает тип изменения как фосфорилирования. Было выявлено только два пептиды с каждым показаны один фосфорилирования (блоков толщиной). Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 10. Вид phosphopeptides колоректального рака и связанные количественный в IGV. На рисунке показано подмножество 50 рак клеточных линий. Он Кроме того показывает четыре колонны блоков в различных оттенков света красный. Цвет указывает относительное изобилие от низкого (белый) до высокого (красный). В то время как четыре колонны первоначально может привести к считаю, что есть 4 пептиды, становится ясно, с связанный на основе последовательности GTF выходного файла что они на самом деле два пептиды, каждый охватывающих сплайс-Джанкшен. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.

Рисунок 11. Просмотр пептида с вариантом аминокислоты в IGV. На рисунке показана пептид с одной аминокислоты вариант сопоставляется геном ссылку в начале перевод гена GPSM1. Вариант позиционируется на аминокислотный остаток 8 и результаты при замещении аланина валина (A→V). Последовательности перевода аннотированных стенограммы (синий) выделить вариант по сравнению с пептидной последовательности. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.