May 22nd, 2018
Aquí presentamos la herramienta proteogenomic PoGo y protocolos para la modificación rápida, cuantitativo, poste-de translación y variante activado mapeo de péptidos identificados a través de espectrometría de masas en los genomas de referencia. Esta herramienta es de uso para integrar y visualizar proteogenomic y estudios proteómicos personal con datos de genómica ortogonal.
El objetivo general de este protocolo de software es demostrar el uso de PoGo para mapear péptidos con modificaciones postraduccionales asociadas e información cuantitativa de experimentos de espectrometría de masas para hacer referencia a genomas y permitir la integración y visualización con datos de genómica ortogonal. Esta herramienta puede ayudar a agregar información genómica a las listas de péptidos generadas por las búsquedas de proteómica de espectrometría de masas, de modo que se pueda facilitar la integración con los datos de secuenciación de ARN. La principal ventaja de esta herramienta es que es fácil de usar, rápida y admite información adicional como modificaciones postraduccionales, cuantificación y varianza de aminoácidos.
Para comenzar, descargue e instale el software que se muestra en este video como se describe en el protocolo de texto adjunto. Una vez instalado, navegue hasta la carpeta de ejecutables de PoGo GUI e inicie el programa haciendo doble clic en el icono de PoGo GUI. Utilice el botón de selección situado junto al ejecutable de PoGo.
A continuación, navegue en la carpeta de ejecutables hasta la subcarpeta del sistema operativo correspondiente y seleccione el archivo PoGo ejecutable. Confirme su selección haciendo clic en el botón Abrir. A continuación, seleccione el archivo de entrada de referencia para las secuencias de proteínas haciendo clic en seleccionar.
Vaya a la carpeta de datos y seleccione el archivo de día rápido de traducción. Confirme su selección haciendo clic en abrir. Seleccione el archivo de anotación de transcripción con el botón Seleccionar.
A continuación, vaya a la carpeta de datos, seleccione el archivo GTF de anotación y haga clic en abrir. Agregue el archivo de identificación de péptidos usando el botón agregar junto a archivos de péptidos. Aquí, seleccione el archivo en el formato compatible MZ Tab, MZ Ident ML o MZ ID, o en el formato de cuatro columnas separadas por tabulaciones.
Además, desmarque las casillas de verificación junto a BED NGTF en la selección del formato de salida. Deje solo PTM BED y GCT marcados. A continuación, seleccione la especie adecuada para los datos de la selección desplegable y comience a mapear haciendo clic en iniciar.
En primer lugar, cargue el archivo de salida PoGo que termina en _ptm. cama en el visor de genómica integradora. Repita para cargar también el archivo que termina en _noptm.bed.
Este archivo contiene todos los péptidos encontrados sin ninguna modificación. Reordene las pistas arrastrándolas y soltándolas en la posición deseada en la lista. Cada archivo se mostrará como pistas separadas con el nombre del archivo identificando la pista.
Cada pista se muestra inicialmente de forma contraída. Para expandirlos, haga clic con el botón derecho en el nombre de la pista y seleccione expandido para obtener una vista completa de los péptidos, incluidas las secuencias. Ahora cargue el archivo que termina en gct.
Este archivo contiene la información de cuantificación de péptidos. A diferencia de los archivos cargados anteriormente, cada muestra anotada se cargará como una pista separada. Reorganice las muestras como desee mediante operaciones de arrastrar y soltar.
Navegue dentro del genoma seleccionando un cromosoma en el menú desplegable, haciendo clic y manteniendo presionada una sección de un cromosoma para acercarla o escribiendo las coordenadas genómicas. El mapeo de PoGo se puede llevar a cabo utilizando la interfaz gráfica de usuario o a través de la interfaz de línea de comandos. En esta parte del protocolo, la interfaz de línea de comandos se utiliza para resaltar la intercambiabilidad.
Para mapear los péptidos variantes obtenidos a través de los pasos anteriores en el protocolo de texto al genoma de referencia, abra un símbolo del sistema y navegue hasta la carpeta de ejecutables de PoGo. A continuación, escriba el comando que se muestra aquí. Confirme la ejecución pulsando la tecla Intro y espere hasta que finalice la ejecución antes de continuar.
Visualice los péptidos mapeados sin discrepancia y con discrepancia en el visor de genómica integrativa. En el software de interfaz gráfica de usuario PoGo, agregue los archivos de identificación de péptidos usando el botón agregar junto a los archivos de péptidos y seleccione uno o varios archivos, así como arrastre y suelte en el campo en blanco debajo de los archivos de péptidos. A continuación, desmarque las casillas de verificación junto a PTM BED, GTF y GCT en la sección de formato de salida y deje solo BED marcado.
Además, seleccione la opción fusionar varios archivos de entrada en una sola salida. Esto dará como resultado un único archivo de salida que combina todos los péptidos de los archivos de entrada. Si se deja esta opción sin seleccionar, se producirá una ejecución secuencial del programa para cada archivo de entrada por separado.
A continuación, seleccione la especie adecuada para los datos del menú desplegable que sea coherente con los archivos NGTF de día rápido. Una vez seleccionado, inicie el mapeo haciendo clic en el botón de inicio. Para generar un concentrador de pistas a partir de péptidos mapeados, abra una ventana de terminal y escriba el siguiente comando en el símbolo del sistema.
Confirme la ejecución pulsando la tecla Intro. La ejecución tardará poco tiempo en finalizar. Una vez finalizado, transfiera el centro de seguimiento generado con todo su contenido a un servidor FTP accesible desde la web o GitHub.
En un navegador web, navegue hasta el explorador del genoma de UCSC y seleccione Mis centros de seguimiento de datos. A continuación, haga clic en la pestaña Mis centros. Copie la dirección URL del centro de seguimiento en el campo de texto y, a continuación, cargue el centro de seguimiento haciendo clic en Agregar concentrador.
Por último, seleccione el navegador del genoma para entrar en la vista del navegador. El centro de pista personalizado se mostrará en la parte superior de la lista. Si varios archivos BED construyeron la base para el concentrador de pistas, cada uno de los archivos se representará como una pista separada dentro del concentrador.
PoGo y otras dos herramientas de mapeo de proteogenómica se comparan aquí por su uso general de memoria y tiempo de ejecución analítica. PoGo supera significativamente a las otras herramientas tanto en velocidad como en memoria, y es capaz de mapear las modificaciones postraduccionales y la información cuantitativa asociada con los péptidos en el genoma. PoGo utiliza la opción de colorear para proporcionar una ayuda visual fácil con respecto a la singularidad del mapeo de péptidos dentro del genoma.
Los mapeos en rojo indican la unicidad de una sola transcripción, mientras que los bloques resaltan el mapeo de un solo gen. Los mapeos de grises muestran péptidos compartidos entre múltiples genes. La opción PTM BED de PoGo redefine el código de colores para adaptarse a diferentes tipos de modificaciones postraduccionales, indicando la ubicación de la modificación con un bloque grueso en el residuo de aminoácido modificado.
En los datos del proteoma que se muestran aquí, que representan el cáncer colorrectal, solo se habían identificado dos péptidos, cada uno de los cuales mostraba una sola fosforilación. La información del archivo GCT de salida proporciona valores cuantitativos para las regiones genómicas cubiertas por péptidos. Los péptidos que atraviesan las uniones de empalme se dividen en sus partes sin conectarse.
Para obtener información más completa sobre el empalme, se requiere adicionalmente el archivo GTF de salida. Una vez que se descargan y configuran las secuencias de proteínas de referencia y la anotación, miles de péptidos se pueden mapear en coordenadas genómicas en menos de cinco minutos cuando no se permiten discrepancias de secuencias. Al intentar mapear péptidos en genomas de referencia usando PoGo, es importante recordar usar secuencias traducidas de transcripciones de codificación de proteínas y anotaciones de transcripción asociadas.
Después de ver este video, debe tener una buena comprensión de cómo usar PoGo y PoGo GUI para mapear péptidos de experimentos de espectrometría de masas de proteómica con información asociada en genomas referenciados y visualizarlos.
Este artículo presenta PoGo, una herramienta proteogenómica diseñada para el mapeo rápido y cuantitativo de péptidos identificados a través de espectrometría de masas en genomas de referencia. Facilita la integración y visualización de datos proteogenómicos junto con datos genómicos ortogonales.