October 8th, 2017
Ao contrário dos dados de sequência de DNA, epigenomic dados não são prontamente submetidos a pesquisas baseadas em texto. Aqui apresentados são os procedimentos para usar uma versão atualizada do GeNemo, uma ferramenta de Bioinformática baseado na web, para realizar pesquisas baseada em padrões para semelhanças em epigenomic dados comparando bancos de dados disponíveis on-line incluindo livre de elementos de DNA com dados do usuário.
O objetivo geral deste vídeo é mostrar aos pesquisadores no campo do estudo epigenético como usar o programa GeNemo para obter regiões de similaridade entre diferentes marcas epigenéticas e diferentes tipos de células. Nosso objetivo ao criar este programa era permitir que os pesquisadores comparassem suas funções de célula de dados com seus vastos bancos de dados públicos conhecidos, como Encode e Mousington. Pesquisa informativa com pesquisa típica por meio de palavras-chave.
À beira de suas células estão três primizações K4 ou outras curvas específicas. Embora essas bagunças sejam úteis, o GeNemo também pode pesquisar suplementos nos dados reais, em vez de semelhanças na descrição dos dados. Suponha que você tenha uma nova proteína de combate ao DNA com pouco ou nenhum conhecimento a priori sobre que tipo de modificações epigenéticas ou contagens de células elas esperam se relacionar.
O GeNemo ainda pode ajudar a restringir os alvos potenciais. O GeNemo pode ler arquivos em vários formatos, incluindo matemática e grego, e usará diferentes métodos de correspondência de padrões Ele também resolverá as regiões de descompressão com base em sua pontuação de similaridade e fornecerá opções de exportação de dados. E agora, vamos mostrar como realizar uma pesquisa GeNemo.
Para usar o GeNemo, você precisará de seu próprio arquivo de dados e BED, ou formato de peruca grande, que pode ser convertido a partir de dados brutos experimentais com ferramentas comuns de bioinformática, como o navegador de genoma UCSC. Primeiro, vá para GeNemo.org. Na página principal, você verá uma caixa de pesquisa com opções de especificação.
Escolha com quais espécies comparar seus dados. Para este tutorial, usaremos homosapiens como espécie de referência. Em seguida, escolha seu próprio arquivo para enviar para o GeNemo.
Esse arquivo pode ser hospedado online ou em sua unidade local. Copie e cole o URL nesta caixa se seus dados estiverem online. Ou clique no botão abaixo para fazer upload de um arquivo de dados local.
Para este tutorial, usaremos um arquivo de amostra. Às vezes, as pesquisas podem levar muito tempo para serem concluídas. Se você não quiser esperar, pode fornecer seu endereço de e-mail nesta caixa.
E você receberá um e-mail com um link para os resultados quando a pesquisa for concluída. Se você estiver fornecendo seus próprios dados no formato BED, há outro URL para fazer upload de um arquivo de peruca grande apenas para fins de exibição. Você também pode especificar um intervalo de pesquisa nesta caixa.
Para especificar um intervalo de pesquisa, você deve especificar o número do cromossomo, bem como o intervalo do par de bases. As duas entradas a seguir seriam lidas da mesma forma. Cromossomo 1: 1-1000000. Ou substituindo os sinais de pontuação por espaços, que é o formato de arquivo BED.
Cromossomo1 1 1000000. Agora, clique no botão de seleção de dados para selecionar quais tipos de faixa pesquisar. Você pode clicar nas caixas de seleção ao lado de cada amostra de dados para pesquisar nela, mas também há uma função de filtro.
A função de filtro é útil para selecionar muitas faixas ao mesmo tempo. Aqui, você pode selecionar de qual categoria filtrar, bem como usar os botões na parte inferior da guia. Os três primeiros botões são bastante autoexplicativos.
Filtrar faz com que todas as faixas que não pertencem às categorias selecionadas sejam desmarcadas. Mais ou menos como um portão e. Por outro lado, excluir faz com que as categorias selecionadas fiquem desmarcadas.
Como um portão não. Quando estiver pronto, clique no botão de pesquisa para iniciar a pesquisa. Se você estiver pesquisando muitas faixas e/ou não tiver especificado um intervalo de pesquisa menor, a pesquisa pode demorar um pouco.
Na caixa de resultados, você verá várias seções do genoma onde seu arquivo de dados e espécies de pesquisa são semelhantes em uma ou mais das sequências de rastreamento especificadas. Você pode clicar em baixar arquivo BED para baixar um arquivo contendo uma lista de regiões correspondentes. Clique no botão mostrar em cada caixa para visualizar a seção correspondente.
Na seção de exibição, você verá sua própria faixa de arquivos de dados, bem como a faixa ou faixas correspondentes. Você pode mover a montante ou a jusante deslizando a barra na parte superior com os rótulos do par de bases. Como você pode ver neste exemplo, a montanha aqui é uma semelhança entre as duas trilhas.
Depois de assistir a este vídeo, você deve ter uma boa ideia de como obter regiões de similaridade entre diferentes marcadores epigenéticos usando o GeNemo. Os resultados da pesquisa GeNemo incluirão marcadores epigenéticos, descoberta de fatores de transcrição, metilação do DNA, acessibilidade cromogênica ou outros tipos de sinal em vários tipos de tecidos que têm padrões semelhantes em determinados locais genômicos aos seus dados de interesse. A partir daí, você pode observar se essa proteína de ligação ao DNA pode interagir com algum fator transcricional, alguns elementos reguladores ou ter algo a ver com a estrutura da cromatina, etc.
Você pode observar ainda quais tipos de tecidos têm a maior semelhança com seu conjunto de dados, o que pode aplicar a função de desenvolvimento de sua proteína de interesse. Ao fazer esse tipo de pesquisa ampla, o GeNemo pode retornar as regiões provisórias, fabricantes e/ou tipos de células em um período de tempo relativamente baixo. A partir desses resultados, também seria possível restringir as áreas potenciais de interesse para derivar experimentos futuros, como escolher a linhagem celular apropriada para a proteína em questão, testar interações com fatores transcricionais específicos ou modificação epigenética via Co IP, 30C, 4C, 5C ou HiC.
Esperamos que este tutorial tenha sido útil e estamos constantemente trabalhando para melhorar o GeNemo. Para esse fim, agradecemos qualquer feedback.
Este artigo apresenta um tutorial sobre o uso do GeNemo, uma ferramenta de bioinformática baseada na web projetada para buscas baseadas em padrões em dados epigenômicos. Os pesquisadores podem comparar seus dados com extensos bancos de dados públicos para identificar regiões de similaridade entre diferentes marcas epigenéticas e tipos celulares.