Phage Phenomics: Physiological Approaches to Characterize Novel Viral Proteins

Savannah E. Sanchez; Daniel A. Cuevas; Jason E. Rostron; Tiffany Y. Liang; Cullen G. Pivaroff; Matthew R. Haynes; Jim Nulton; Ben Felts; Barbara A. Bailey; Peter Salamon; Robert A. Edwards; Alex B. Burgin; Anca M. Segall; Forest Rohwer

doi:10.3791/52854

JoVE Journal > Immunology and Infection

Immunology and Infection

Phenomics fago: Abordagens fisiológicas para Caracterizar Novel Proteínas Virais

Published: June 11, 2015

doi:

10.3791/52854

Summary

Here, we present phenomic approaches for the functional characterization of putative phage genes. Techniques include a developed assay capable of monitoring host anabolic metabolism, the Multi-phenotype Assay Plates (MAPs), in addition to the established method of metabolomics, capable of measuring effects to catabolic metabolism.

Abstract

Investigações em curso em interações fago-hospedeiro são dependentes de extrapolar o conhecimento a partir de (meta) genomas. Curiosamente, 60-95% de todas as sequências de fagos partes sem homologia com proteínas anotados actuais. Como resultado, uma grande proporção de genes de fagos são anotados como hipotética. Esta realidade afeta fortemente a anotação dos dois genes metabólicos estruturais e auxiliares. Apresentamos aqui os métodos Phenomic concebidos para capturar a resposta fisiológica (s) de um hospedeiro seleccionado durante a expressão de um destes genes de fago desconhecidos. Multi-fenótipo placas de ensaio (MAPs) são utilizados para monitorizar a diversidade de utilização do substrato de acolhimento e formação subsequente de biomassa, enquanto fornece metaboloma análise bi-produto através da monitorização abundância e diversidade metabolito. Ambas as ferramentas são utilizadas simultaneamente para proporcionar um perfil fenotípico relacionado com a expressão de um único fago putativo enquadramento de leitura aberto (ORF). Os resultados representativos para os dois métodos são comparadas, highlighting as diferenças perfil fenotípico de uma série transportar tanto genes de fago estruturais ou metabólicas putativos. Além disso, as técnicas de visualização e de alto rendimento condutas computacionais que facilitaram a análise experimental são apresentados.

Introduction

Os vírus que infectam bactérias (aka bacteriófago ou fago) são estimados de existir em mais do que 10 ^31, como partículas de vírus (VLP) globalmente e ultrapassam todos os outros organismos no ambiente de um ^1,2. O primeiro estudo a investigar metagenômica as comunidades virais associadas a ambientes marinhos focada na quantificação da diversidade visto dentro da fração viral ^3. Além disso, Breitbart e seus colegas descobriram que mais de 65% das sequências virais da comunidade compartilhada nenhuma homologia com as seqüências disponíveis em bases de dados públicas. Metagenomic estudos posteriores encontraram evidências semelhantes: metagenomes de sedimentos marinhos em San Diego, Califórnia conter 75% desconhecidos sequências virais ^4; metagenomes de lagos hipersalinas do Mar Salton conter 98% desconhecidos sequências virais ^5; e metagenomes associado de corais contêm 95-98% desconhecidos sequências virais ^6. Esta acumulação de informação não anotadas resultou emmaterial genético do fago ser "a matéria escura do universo biológico" ^7.

Caracterização genômica de fago se baseia na identificação de similaridade de sequência através da comparação em bases de dados de ácidos nucleicos e de proteínas existentes. Porque a informação genética codificada-fago é predominantemente desconhecido, os métodos baseados em homologia são ineficazes. Dentro do seu genoma, fagos codificam tipicamente três tipos principais de genes: genes de transcrição e de replicação, genes do metabolismo, e os genes estruturais. Os genes de transcrição e replicação (classe I / II genes ⁸⁾ incluem polimerases, primases, endo / exo-nucleases, e cinases. Estes genes são altamente conservadas devido à sua importância na infecção pelo fago, transcrevendo e replicar material genético do fago. Polimerases de fago são prontamente identificados utilizando métodos tradicionais de homologia de sequência, devido à sua conservação global ⁹ e ter sido mostrado para servir como marcadores filogenéticos eficazes ^10.Em contraste, o fago metabólica e genes estruturais (genes II / III de classe ⁸⁾ estão cada vez mais frequentemente divergente e anotada como genes hipotéticos.

Fago genes metabólicos afectar a capacidade metabólica do hospedeiro e não são necessariamente necessário para a replicação virai. Estes genes, muitas vezes referidos como genes metabólicos auxiliares ^(11), AMGs parecem modular o metabolismo de acolhimento e permitir que a progressão óptima da infecção e do sucesso da maturação do virião. AMGs têm sido associados com a utilização e absorção de nutrientes limitantes ou em vias de produção de energia. Alguns exemplos incluem genes fotossistema encontrados nos genomas de vários cyanophage ^12-16, os genes ligados ao metabolismo e regulados pelo fosfato de ^17,18, e a utilização da via da pentose fosfato de fago dNTP biossíntese ^18,19. Em comparação, os genes estruturais estão entre os meados de genes tardios produzidos durante a infecção e variam entre diferentes fago-hosistemas de st. A produção de proteínas estruturais são dependentes da disponibilidade de dNTP viral, e piscinas de energia para a sua transcrição, tradução e montagem ^8. As proteínas da cápside de fibra e cauda estrutural são considerados como os mais divergentes de todos os genes que codificam proteínas virais e são necessárias para produção de viriões de sucesso. Sua divergência é tipicamente atribuído ao papel activo que desempenham na formação vírus-anfitrião coevolução ^20. Proteínas divergentes, independentemente da classe de genes, são facilmente esquecido quando usando técnicas de homologia e alinhamento de sequências tradicionais. Um esforço para corrigir as limitações observadas com os rigorosos comparações de sequência resultou em ferramentas da bioinformática capazes de utilizar as características de sequências para determinar associação, tais como redes neurais artificiais ^21. Redes neurais artificiais (RNAs) permitir a predição de genes estruturais e metabólicas, no entanto, necessitam de validação experimental jusante para caracterizar diretamentea função do gene.

O objetivo deste artigo é o de fornecer protocolos Phenomic capazes de monitorar tanto o metabolismo anabólico e catabólico de uma bactéria hospedeira durante a expressão de um gene fago novela, funcionalmente previu através de RNAs. O campo de phenomics, a biologia associado com fenótipos celulares, está bem estabelecida na biologia de sistemas para ajudar na investigação de proteínas com função desconhecida ou pleiotrópico. Phenomic ferramentas são usadas para conectar informação fenotípica à informação genotípica. Nossa hipótese de genes de fago putativos que a sua função (s) podem ser determinadas através da observação de acolhimento efeitos fisiológicos durante a expressão do gene fago. Para investigar essa hipótese, foram escolhidos dois métodos quantitativos. Placas de multi-fenótipo de ensaio (MAPs) foram utilizados para monitorizar a utilização do substrato de acolhimento e a formação subsequente de biomassa, enquanto metaboloma medido diversidade metabolito hospedeiro e abundância relativa durante o crescimento em Environ específicacondições mentais. Proteínas estruturais e metabólicas putativos foram sobre-expressos em Escherichia coli e os resultados representativos de ambas as experiências são comparados. Inúmeras técnicas visuais e dutos de processamento de alto rendimento são apresentados para facilitar a replicação experimental. Por último, a reprodutibilidade e a precisão dos métodos apresentados são discutidos no contexto de efeitos fisiológicos esperado para uma proteína da cãpside e anotada proteína metabólica fago, tioredoxina, mais dois AMGs putativos.

Protocol

1. Preparação da Multi-fenótipo Assay Plate (MAP) Substratos, Basal Media, Pré-crescimento Media, ea solução tampão Faça 50 ml de 1,0 – stocks de substrato de 1,25%. Dissolve-se 1,0-1,25% (w / v) de substrato sólido em água estéril (calor, se necessário). Filtro de esterilizar soluções com uma unidade de filtro de 0,22 um e stocks de loja, em RT. Exemplos de substratos utilizados nestas experiências são apresentados na Tabela 2. Adicione 250 ml de meio basal 3x para todas as classes de substrato (de carbono, azoto, enxofre e fósforo). Os MOPS (3-morfolinopropano-1-sulfonato) meios basais base 22 contém os seguintes: MOPS 1x (40 mM de MOPS + 10 mM de Tricina), 0,4% de glicerol, NH * 9,5 mm * 4 Cl, 0,25 mM de NaSO 4 *, 1.0 mM de MgSO4 *, 1,32 mM de K 2 HPO 4 *, 10 mM de KCl, 0,5 ^ M de CaCl2, 5 mM de NaCl, 6 | iM de FeCl3, e 0,1% (w / v) de L-arabinose ** (Tabelas 1 e 2) . Nota: * Estes compostos não são incluídos dependendo da mídia basal. Por exemplo, 0,4% de glicerol não é usado nos meios basais de carbono e enxofre no meio basal 1,0 mM de MgSO 4 é substituído por 1,0 mM de MgCl 2. ** L-arabinose é específico para a indução do vector de promotor pBAD, pEMB11, o qual foi transformado num ara – E. coli K-12 estirpe (BW 27784) 23. Adicionar a cada componente de meio basal para um frasco estéril e trazer solução para o volume. Misture bem. Com uma unidade de filtro de 0,22 um, filtro de esterilizar cada um dos meios basais dentro de uma garrafa estéril. Adicione 500 ml de meio MOPS pré-crescimento. MOPS baseado mídia pré-crescimento de 22 contém o seguinte: 1x MOPS (MOPS 40 mm + 10 Tricina mM), 0,4% de glicerol, 9,5 mM NH 4 Cl, 0,25 mM NaSO4, 1,0 mM MgSO4, 1,32 mM K 2 HPO 4, KCl 10 mM, 0,5 uM de CaCl2, NaCl mM 5, e 6 pM FeCl3. Adicione cadacomponente do meio de pré-crescimento de um frasco estéril e perfazer o volume. Filtrar esterilizar com uma unidade de filtro de 0,22 um, em seguida, adicionar ampicilina para uma concentração final de 100 ug / ml. Guardar a solução a 4 ° C. Adicione 500 ml de 0,5x Luria-Bertani (LB) placas de agar. Para um frasco estéril, adicionar componentes LB para fazer uma concentração de 0,5x (1,25 g de extracto de levedura, 2,5 g de NaCl, 2,5 g de triptona, 7,5 g de agar). Misture bem e autoclave para esterilizar. Ágar fresco, em seguida adicionar 100 ug / ml de ampicilina antibiótica com mistura. Pour ~ 25 ml de agar em pratos de Petri, para permitir definir e armazenar a 4 ° C até ser necessário. Adicione 250 ml de Tris 10 mM (pH 7,4) mais 10 mM de solução tampão de MgSO4. Filtro de esterilizar com uma unidade de 0,22 nm, e uma solução de armazenamento em temperatura ambiente. 2. Preparação da suspensão bacteriana celular- Prepare novas colônias. A partir de um estoque de glicerol congelado 12,5%, prato fresco E. coli clones em agar 0,5x LB contendo 100 ug / ml de ampicilina. Incubar a 37 ° C durante 24 h. Prepare culturas líquidas: Pipetar 3 ml de meio de pré-cultura contendo 100 ug / ml de ampicilina em tubos de cultura. Para cada clone, usar triplicados biológicos. Inocular colônias, independente da secção 2.1 para tubos de cultura preparados. Incubar a 37 ° C com agitação durante 22 h. Sedimentar e lavar as células bacterianas: Transferência de O / N culturas em tubos de microcentrífuga de 1,7 ml. Células de pellets através de centrifugação à velocidade máxima (16.900 x g) durante 2 minutos numa microcentrífuga. Decantar o sobrenadante e lavar as células por re-suspensão em 500 ul de 10 mM Tris / MgSO 4 mM de tampão 10. Repita. Re-pelota de células, decantar o sobrenadante e re-suspender as células em 1 ml de 10 mM Tris / MgSO 4 mM de tampão 10. Medir a densidade celular e concentrar células (se necessário): Diluir as células do ponto 2.3.3 10 vezes emTris 10 mM / 10 mM de MgSO4 tampão e transferir esta diluição numa cuvete. Medir a densidade óptica (DO 600 nm) desta diluição e ficha. Concentre-se células para alcançar concentração final de 0,07 (OD 600 nm) nos mapas (as células serão diluídos 15 vezes quando eles são adicionados aos mapas, portanto, as células precisam para estar em uma concentração inicial de OD 600 nm = 1,05). Transferência de suspensão de células concentradas em um reservatório e salvar (a TA) até a etapa de preparação 3.5 Maps. 3. Preparação de Multi-fenótipo placas de ensaio (mapas) Rotular mapas. Etiqueta estéreis de 96 poços de micro-placas de titulação com uma E. número de identificação clone coli e mapa Tipo esquemático. Alíquota de água estéril em mapas. Transferência assepticamente água estéril em um reservatório de líquido. Pipetar 60 ul em cada poço da placa de micro-titulação, utilizando uma pipeta multi-canal. Alíquota media basal intO Maps. Transferência assepticamente 3x mídia basais em um reservatório de líquido. Pipetar 50 ul em cada poço da placa de micro-titulação, utilizando uma pipeta multi-canal. Repita os passos 3.2 e 3.3 para cada mídia basais utilizados no esquema MAP. Substratos alíquotas em mapas. Transferir 30 mL de cada substrato no poço apropriado dos mapas. Adicionar suspensão bacteriana aos mapas. Transferir 10 uL de células bacterianas de secção 2.4.2 para cada cavidade do mapa através de uma pipeta multi-canal. Mudar dicas antes de re-introdução de pipeta de volta para o estoque de cultura. Capa mapas com película adesiva. Cobrir cada placa com um único filme placa adesiva. Pressione firmemente a película no topo das cavidades da placa e ao longo dos bordos para criar uma vedação uniforme e firme. Remover o excesso de película a partir das orlas da placa de micro-titulação com uma lâmina de barbear estéril. Medir a densidade óptica de mapas: Coloque MAPs preparados no "Input" manga de um multi-plate spectroleitor de placas fotômetro. Abra a placa do software leitor e criar um protocolo que mede absorvância (DO 600 nm) a cada 30 minutos, para um total de 32 horas, com 60 segundos de agitação entre as leituras. Ajuste da temperatura no aparelho a 37 ° C. Comece protocolo uma vez mapas têm equilibrada para ajustar a temperatura. Após 32 horas, remover mapas do "Output" manga do leitor de placas. Escreva em cada arquivo de texto de dados para incluir: a E. número de identificação clone coli, data em que o MAP funcionou, eo tipo de esquema MAP. 4. Multi-fenótipo placas de ensaio (mapas) Processamento e parametrização Avaliar curvas de crescimento que utilizem um processo de controle de qualidade automatizada, por exemplo, PMAnalyzer 24. Verificar que as curvas de crescimento têm OD 600 nm <0,20 no primeiro 2 horas. Não utilizar absorvância no ponto de tempo inicial (t0) no filtro devido a artefactos de condensação, que tipicamente resolver at 1 (30 min). Retirar as curvas de crescimento que violam filtro QA. Salve informações curva (nome da amostra, bem número, e OD 600 valores nm) em um arquivo de saída separado para referência futura. Continuar com a análise de curva de crescimento se passa filtro QA. Calcular as curvas de crescimento medianas. Usando replicar os dados, por poço, calcular a curva de crescimento médio, tendo a densidade óptica média (DO 600 nm) de valor em cada ponto de tempo. Registro resultante curvas de crescimento medianas em um arquivo de saída separado para uso futuro. Calcular o modelo logístico de melhor ajuste para cada curva de crescimento usando uma adaptação da equação proposta por Zwietering 25. A equação logística inclui três parâmetros que descrevem o crescimento bacteriano: O intervalo de tempo, λ (h), a taxa máxima de crescimento, μ max (OD 600 nm 100 -1), e o rendimento final de biomassa, α (OD 600 nm). Utilizar os dados no tempo = 30 min (y 1) como o valor inicial devido a artefatos de condensação. [1] Calcule a taxa máxima de crescimento usando uma pesquisa direta. Grave a maior taxa de variação ao longo de um intervalo de 90 min dentro dos dados. [2] Estimar o rendimento final da biomassa através da procura para o valor assintótico superior da maior média móvel ao longo de um 90 min janela. Especificamente, definir como a assíntota da curva de crescimento. [3] Usando o max μ e A valores de 4.3.1 e 4.3.2, encontrar o valor λ por tentar todos os valores de λ: [4] Use cada valor de λ para calcular uma soma de erros ao quadrado (SSE). Use o menor SSE é o SSE (λS): /files/ftp_upload/52854/52854eq5.jpg "/> [5] 5. Fenótipo análise de mapas Calcular o nível de crescimento (GL) para cada curva de crescimento para avaliar o crescimento global, por clone por substrato. Definir GL como a média harmônica dos valores equipado-logística deslocados: [6] Atribuir um fenótipo para cada curva de crescimento com base nos valores Gl. Aqui, as quatro fenótipos utilizados são: o crescimento esperado, nenhum crescimento, ganho de função, e perda de função. Determinar fenótipos através da comparação do crescimento em todos os clones num substrato específico, em termos de desvios padrão de distância da média. Utilizar esta estatística e um limite mínimo de crescimento para designar o fenotipo apresentada pela curva de crescimento (Figura 1A, B). A Figura 1C apresenta exemplos de atribuição fenótipo. Definir o crescimento como GL ≥ 0,4 (Figure 1A, B). Definir ganho de função (Figura 1C, verde) como tendo uma GL> dois desvios padrão acima da média e um significativo> o limiar de crescimento. A perda de função (Figura 1C, vermelho) é definida como tendo uma GL <dois desvios padrão abaixo da média e um significativo> o limiar de crescimento. Criar representações visuais do conjunto de dados com base em fenótipos e curvas de crescimento. Ver dinâmica de crescimento que retratam OD 600 nm valores como a cor para comparar rapidamente as curvas de crescimento entre vários clones (Figura 2). Ver distribuições fenotípicas entre todos os clones com base em condições de crescimento (Figura 3). 6. Construir o aparelho de cultura contínua Construção porta reactor (Figura 4A, B). Perfurar três em 1/4. Furos, espaçados 3/4 in. Distante, na tampa do reator cultura contínua. Foα portuárias r: parafuso um painel estilo fêmea rosca luer montar a 1/16 em farpa da parte inferior da tampa com a farpa apontando para cima, para fora da tampa.. Farpa seguro com um painel de 1/4 in. Montar contra-porca. Para a porta β: parafuso um painel estilo fêmea rosca luer montar a 1/16 em farpa com a farpa apontando para cima, para fora da tampa.. Farpa seguro com um painel de 1/4 in. Montar contra-porca. Para a porta γ: parafuso um painel estilo fêmea rosca luer montar a 1/16 em farpa da parte inferior da tampa de modo a farpa está apontando para cima, para fora da tampa.. Farpa seguro com 1/4 in. Painel de montagem da porca de bloqueio. Parafuso de uma luer macho com anel de bloqueio integral a 1/8 in. Mangueira de furo larga à farpa encaixe no interior da tampa. Para a porta de saída: perfurar um buraco em 5/16 na marca de 75 ml do reator cultura contínua.. Corte 3/4 in. Off final porca de 1/4 in. Farpado montagem antepara. Enroscar o 1/4 em. Antepara farpado encaixe (gaxeta está no exterior da garrafa e a porca está no interior, Figura 4B). Alimentando construção do porto frasco (Figura 4C). Faça dois 1/4 in. Buracos espaçados em 1. Apart na tampa da mamadeira. Para o δ porta: um parafuso painel estilo fêmea rosca luer montar a 1/8 em farpa com a farpa apontando para cima, para fora da tampa.. Farpa seguro com um painel de 1/4 in. Montar contra-porca. Para o ε porta: um parafuso painel estilo fêmea rosca luer montar a 1/16 em farpa com a farpa apontando para cima, para fora da tampa.. Farpa seguro com um painel de 1/4 in. Montar contra-porca. Parafuso de uma luer macho com anel de bloqueio integral a 1/8 in. Mangueira de furo larga à boquilha, no interior da tampa. Tubos de alimentação e as extensões de tubo: Cortar duas uma em. Peças de tubagem (1/8 pol. De diâmetro externo (OD) x 1/16 in. De diâmetro interno (ID)). Peças caber em portos α γ e do reator cultura contínua feita na seção 5.2. Corte um único 1 em. Pedaço de tubing (1/4 in. OD x 1/8 in. ID). Peça Fit para Β porta do reactor cultura contínua. Corte um único 3,5 in. Pedaço de tubo (1/8 in. OD x 1/16 pol. ID). Encaixe esta peça para o interior de γ portuárias, no luer macho com anel de bloqueio integral a 1/8 in. Mangueira furo de largura. Porto γ representa a porta de amostragem do reactor cultura contínua. Corte um único 1 em. Pedaço de tubo (1/4 in. OD x 1/8 in. ID). Encaixe esta peça na porta δ do biberão. Corte um único 11 pol. Pedaço de tubo (1/16 pol. OD x 1/8 in. ID). Montar este pedaço para o interior da porta ε do biberão, no conector luer macho com anel de bloqueio integral a 1/8 in. Mangueira de furo larga. Cortar duas 18 em. Peças de tubagem (1/8 pol. OD x 1/16 in. ID). Monte uma peça para a porta ε do biberão. Salve a outra peça para a secção 7. 7. Executando culturas contínuas para Metabolomics Esterilizar materiais: Autoclave os materiais secos durante 30 min. Certifique-se de embrulhar tampa da mamadeira feita na seção 5 em folha de alumínio. Mantenha ligado tubulação reta. Enrole tampa do reator cultura contínua, feita na seção 5, em papel alumínio. Mantenha ligado tubulação reta. Enrole 18 pol. Corte tubulação em 6.3.5 eo menor adaptador de tubulação da bomba peristáltica em papel alumínio. Mantenha tubulação reta. Autoclave durante 30 min. Faça 2 L de caldo de LB 0,5x. Na mamadeira, fazer 0,5x caldo LB. Cubra com papel alumínio mamadeira. Autoclave durante 1 hora. Faça 70 ml de caldo LB 0,5x. Pour caldo de cultura para o reactor contínuo. Coloque uma barra de agitação no reator cultura contínua. Cubra com papel alumínio e reactor autoclave durante 30 minutos. Cultura contínua set-up: Célula-suspensão bacteriana. A partir de um estoque de glicerol congelado 12,5%, prato fresco E. Os clones de E. coli em agar 0,5x LB contendo 100 ug / ml de ampicilina. Incubara 37 ° C durante 24 h. Inocular uma colónia isolada em 3 ml de caldo LB 0,5x contendo 100 ug / ml de ampicilina. Para cada clone de usar triplicados biológicos. Incubar a 37 ° C com agitação durante 22 h. Conecte as peças juntas. Coloque todos os materiais esterilizados em uma cabine de segurança biológica e transformar a luz ultravioleta na mídia enquanto esfria. Uma vez que tem meios de refrigeração, adicionar 0,1% de L-arabinose e 100 ug / ml de ampicilina para todos caldo LB 0,5x. Desembrulhar cap cultura reactor contínuo e parafuso para o reactor. Evite tocar no tubo de amostragem. Desembrulhar a tampa do frasco de alimentação e parafuso para a biberão. Evite tocar no tubo de amostragem. Manter a 18 pol. Tubulação conectada à porta ε estéril. Un-enrolar a faixa 18 pol. E adaptador de tubulação da bomba peristáltica. Instale um extremidade livre do 18 pol. Tubulação em uma extremidade do adaptador de tubulação da bomba peristáltica. Monte a outra extremidade do adaptador de tubulação da bomba peristáltica paraa 18 pol. tubulação conectada à porta ε da tampa do frasco de alimentação. Parafuso de 0,22 unidades de filtro para portas β e δ do reactor cultura contínua. Parafuso de uma unidade de filtro de 0,22 um na placa de porta α. Para a unidade de filtro de 0,22 um, encaixar a extremidade livre do 18 em. Tubos. Iniciar a cultura contínua. Na capa de segurança biológica, inocular o reactor de cultura contínua com 100 ul de cultura D / N feitas na secção 7.2.1.1. Primeiro sistema antes de passar a cultura contínua em uma temperatura de 37 ° C incubadora. Na incubadora tem uma placa de agitação magnética e mini-bomba peristáltica configurar. Encaixe o adaptador de tubulação da bomba peristáltica na bomba peristáltica. Tubos do biberão começa no "In" lado e tubo levando ao reactor começa no lado "para fora". Defina a bomba peristáltica para: "FAST". Comece a bomba peristáltica, alternando para R20; FRENTE ". Verificar que a mídia começa a fluir através da tubagem. Coloque reactor na placa de agitação magnética e começar a misturar. Reactor cultura contínua deve equilibrar durante 24 horas antes da amostragem. A amostragem da cultura contínua. Parafuso a 5 ml seringa luer lok para γ porta e puxar para cima 4,5 ml de cultura. Use 500 ul da cultura para medir a densidade (OD 600 nm). Dilui-se as células para fazer 4 x 1 ml de culturas a DO600 nm = 0,35. Aliquota diluída culturas em tubos de microcentrífuga de 1,7 ml. Repita amostragem a cada 12 horas por 4 dias. Prepare amostras para GC-TOFMS: Células de pellets por centrifugação a velocidade máxima (16.900 xg) por 2 min. Decantar o sobrenadante. Lavar as células com 500 ul de solução salina tamponada com fosfato (PBS). Repita este passo. Decantar o sobrenadante uma última vez, e em seguida submergir tubos de microcentrífuga com células peletizadas em azoto líquido até borbulhar paragens. Srasgou amostras em freezer -80 ° C. 8. Execução de série culturas lote de passagem para Metabolomics Preparar-suspensão celular bacteriana. A partir de um estoque de glicerol congelado 12,5%, prato fresco E. coli clones em agar LB contendo 0,5 x 100 ng / mL ampicilina. Incubar a 37 ° C durante 24 h. Inocular colónias individuais em 3 ml de caldo LB contendo 0,5 x 100 ng / mL ampicilina. Use triplicados biológicas para cada clone. Culturas de lote passagem seriada. Subcultura O / N a partir de 8.1.1 através de uma diluição de 500 vezes em 3 ml de caldo LB contendo 50 ug / ml de ampicilina e 0,1% de L-arabinose. Subcultura deve ter um OD 600 nm <0,005. Incubar a 37 ° C com agitação. Verificar a densidade óptica (DO 600 nm) a 2 e 2,5 horas. Cultivar células para atingir DO600 nm = 0,35. Através de uma subcultura de 500 vezes dilução em 3 ml de caldo LB contendo 50 ug / ml de ampicilina e 0,1% de L-arabinose. Subcultura deve ter um OD 600 nm <0,005. Verificar a densidade óptica (DO 600 nm) a 2 e 2,5 horas. Cultivar células para atingir DO600 nm = 0,35. Amostragem culturas lote de passagem serial. Utilizando fórceps estéreis, colocar um filtro de membrana de 0,22 um em cima de um colector de filtro. Alíquota de 1 ml de tampão fosfato (PBS) para o papel de filtro e, em seguida, ligar a bomba de vácuo. Repetir a adição de 1 ml de PBS. Transferir 1 ml de subcultura de secção 8.2.3 para o papel de filtro. A partir daqui, mover-se rapidamente para obter amostras em nitrogênio líquido imediatamente. Complete esta em 1 min. Alíquotas de 1 ml de PBS em papel de filtro para lavar amostra. Lave rapidamente sem derramar amostra sobre os lados do papel de filtro. Repita. Utilizando uma pinça estéril filtro de lugar em um tubo de microcentrífuga de 1,7 ml por dobrando cuidadosamente o filtro. Mergulhe tubo de microcentrífuga em nitrogênio líquido até borbulhar paradas. Amostra de loja em freezer -80 ° C. 9. Metabolite Análise e Processamento Navio de três amostras por clone em gelo seco para uma instalação de núcleo metabolômica para o processamento da amostra, análise e normalização da GC-TOFMS. Para cada amostra, determinar a média, mediana, desvio padrão e coeficiente de variação entre os metabólitos, utilizando dados replicados. Para a análise estatística, o código manualmente um gasoduto QA usando instruções condicionais e execuções repetitivas 26 para remover metabólitos que não seguem as condições definidas. Para Condição 1, remover metabólitos em que mais de duas amostras têm abundância zero. Remover padrões internos dos perfis metabolômicos. Para Condição 2, remover os metabolitos que não são encontrados nas células de interesse. Aqui, remova as seguintes metabólitos: indole 3 de etilo, dihydroabiet ácido ic, ácido nonadecanóico, ácido salicílico, salicilaldeído, colesterol, fenol, 1-monoestearina, octadecanol, 1-monopalmitina, dodecano, dodecanol, 1-hexadecanol, 5-metoxitriptamina, ácido benzóico, ácido pentadecanóico, ácido fosfórico, ácido pelargónico, palmítico , ácido cáprico, hidroxilamina, ácido esteárico, ácido mirístico, maleimida, levoglucosano e ácido 4-hidroxibutírico. Para Condição 3, remover os metabolitos cujo coeficiente de variação for maior que 1. Capturar efeitos globais metabolômica vendo os metabólitos abundância relativa. Criar uma representação visual da abundância metabolito mediana por clone para cada metabolito (Figura 6). Identificam outliers observando frequências par clone-metabolito. Calcular a pontuação Z para cada valor médio de cada metabólito em um clone. Calcular escores z utilizando a seguinte equação: /52854/52854eq7.jpg "/> [7] Nota: Termo MC X representa o nível de abundância de um metabolito específica para um clone específico. Μ termo C representa a média de todos os clones para um metabolito específico. Σ termo C é o desvio padrão associado. Criar uma representação visual dos dados discrepantes em que são destacados (dados não fornecidos).

Representative Results

Todas as amostras utilizadas para determinar as grelhas de leitura aberta (ORF) selecionados neste estudo foram coletados de Starbuck Island, local 7 (STAR7) e Caroline Atoll, Sítio 9 (CAR9) da linha ilhas do sul. Estima-se 100 L de água do mar a partir destes locais foi recolhido abaixo as bombas de esgoto camada limite usando coral, como descrito anteriormente 5. Conteúdo das bombas estavam sujeitos a fragmentação através de grandes filtros de poros para remover pequenos eucariontes e posteriormente concentrada utilizando 100 kDa filtros de fluxo tangencial deixando apenas micróbios e viral como partículas (VLP). Para separar as VLP, a água do mar remanescente foi passado através de filtros de 0,45 um, resultando na virome. O clorofórmio foi introduzido para esta fracção viral para parar o crescimento de quaisquer células remanescentes e armazenado a 4 ° C. As VLP foram purificadas utilizando o método de cloreto de césio, em que os gradientes de densidade de separar por centrifugação e permitem a recuperação de Vir~ iões a 1,35 g / ml a 1,5 g / ml 3. O ADN virai foi extraído utilizando um CTAB / fenol: clorofórmio protocolo e amplificado através de amplificação por deslocamento de múltiplos utilizando reagentes phi29. A sequenciação do virome foi realizado com a tecnologia disponível no mercado pyrosequencing. Bioinformatics utilizados no processamento e selecção de ORFs virais para este estudo são as seguintes. Três etapas de pré-processamento foram utilizados nas metagenomes virais CAR9 e STAR7. Em primeiro lugar, o software público foi usado para remover sequências marcadoras que resultaram da amplificação do ADN viral antes da sequenciação 27. Em segundo lugar, artefatos de sequenciamento comuns, tais como duplicatas de seqüência e baixo número de cópias foram filtrados para fora do conjunto de dados através de um programa de bioinformática adicional 28. Por fim, a remoção da contaminação sequência externa 29 foi realizada para as sequências que tinham ≥ 90% de cobertura e ≥ 94% de identidade com sequências em bases de dados: v RefSeqgenomas irus; Humano – Referência GRCh37; Humano – Celera Genomics; Humano – Craig Venter (HuRef); Humano – Seong-Jin Kim (coreano); Humano – Chromosome 7 versão 2 (TCAG); e Humano – James Watson, Yanhuang (YH; asiática), Yoruba (NA18507; Africano) sequências de referência 21. Na sequência destes processos, sequências de amostras CAR9 totalizou 591.600 e sequências STAR7 totalizaram 939.311. Estas sequências foram enviados para MGRAST e montados via software assembler usando as configurações padrão. Contigs foram traduzidos em seis quadros de leitura e frames putativos de leitura aberta (pORFs) foram identificados usando scripts, como descrito anteriormente 21. Para identificar ORF desconhecidos foram realizadas uma série de pesquisas de similaridade baseado remover ORFs de função conhecida. Resumidamente, os seguintes foram realizadas pesquisas com os seus critérios de pesquisa correspondentes 21: Similaridade significativa de ≥ 95% de identidade ao longo ≥40 pares de bases (pb) por MGRAST BLAT na base de dados M5NR. Similaridade significativa (e-valor ≤ 0,001) por TBLASTN contra todas metagenomes públicas em My Resource metagenoma banco de dados. Similaridade significativa (e-valor ≤ 0,001) por BLASTP e TBLASTN contra banco de dados NR. Similaridade significativa (e-valor ≤ 0,001) por RPS-BLAST contra o banco de dados Conserved Domain. Traduções de proteína a partir de uma fracção seleccionada de cada conjunto de dados de estruturas de proteínas em comparação contra resolvidos no Protein Data Bank. Cálculo das freqüências dinucleotidicos usando pacote Dinucleotide Assinaturas. Os pORFs resultantes foram concebidos para expressão em E. coli usando software de design gene disponível publicamente. Back-tradução das sequências de amino-ácidos empregou uma tabela de uso Universal Codon projetado para acomodar a expressão em E. coli com um limiar mínimo a utilização de 2%. Sequência de reconhecimento da enzima de restriçãos para BamHI e HindIII foram excluídas das sequências para facilitar a clonagem. Uma empresa fora sintetizado o gene obtido por engenharia sequências de 30 e, em seguida, as ORFs foram clonados num vector de cópia de médio número promotor pBAD, pEMB11, através de clonagem de enzima de restrição padrão. Todos os clones foram transformados em E. coli K-12 estirpe BW 27784 23. Placas Multi-fenótipo ensaio (mapas) Um gasoduto de alto rendimento e software robusto foi aproveitado para análise dos mapas, o PMAnalyzer 24. O gasoduto foi desenvolvido em um ambiente de servidor Linux e executa várias etapas, incluindo: análise de arquivos de densidade óptica, a formatação de dados em arquivos de texto legível, pré-processamento de curvas de crescimento para a garantia de qualidade (QA), e realizando técnicas de modelagem matemática para analisar as curvas de crescimento . Os scripts modelagem primários foram desenvolvidos em Python versão 2.7.5 para fazer uso do módulo Pylab. Mapas reprodutibilidade foi avaliada utilizando o erro padrão (SE) para dados replicados (Figura 2A). As curvas de crescimento foram comparadas com matérias de curvas de crescimento de logística para determinar se o programa PMAnalyzer crescimento parametrizado com precisão e modelado clone decurso da experimentação (dados não apresentados). Para mais informações sobre a exactidão ea validade dos mapas e PMAnalyzer ver Cuevas 24 et al. Após a validação do método, mapas de dados foi analisada utilizando os múltiplos parâmetros, como taxa máxima de crescimento (μ max) e nível de crescimento (GL), fornecidos pelo pipeline de processamento. Visualização comparativa de curvas de crescimento é muitas vezes usado para interpretação de dados de crescimento; no entanto, o número de curvas que podem ser visualizados por vez para a comparação tem limitações. Para analisar numerosas curvas de crescimento simultaneamente, mapa de calor parcelas derivados foram implorou para comparar dezenas de clones cultivados em um único substrate contra a resposta média que 'condições (Figura 2B). A influência colocada por sobre-expressão de uma nova proteína de fago é observado através de mudanças nos parâmetros da curva, especificamente: lag fase, fase exponencial ea produção de biomassa máxima (asymptote). Como um exemplo, a subida íngreme da fase de latência em fase exponencial modelado na curva de crescimento para a proteína da cápside (Figura 2A) é reproduzida por uma rápida mudança na intensidade de cor de preto para branco para o mesmo clone na trama dinâmica da Figura 2B . Para obter uma imagem global de distribuição clone através substratos, classificações fenotípicas derivados do GL foram usadas (Figura 3). Aqui, as quatro fenótipos são separados em quatro gráficos onde a altura de cada barra representa o número de clones que exibem o fenótipo de um substrato específico. Outliers nos dados são reconhecidos como clones que caem no "ganho de function "ou" perda de função categoria ". Outliers pode, então, ser procurados individualmente e investigado mais de perto experimentalmente. Além disso, reconhece polarizações análise global de substrato no ensaio. Os substratos tais como fenilalanina, ácido málico, glicina e resultou num "nenhum crescimento" classificação. Substratos que constantemente caem na nenhuma classificação de crescimento, em todos os clones, não são fortemente ponderada em caracterização funcional jusante. Metabolomics Os produtos catabólicos de clones que expressam genes de fago desconhecidos foram identificados utilizando metabolômica. Resumidamente, os clones foram cultivadas sob quer uma cultura contínua ou passagem em série em meio de cultura de lote antes de ser enviado para análise GC-TOFMS em uma instalação do núcleo metabolômica. Para mais detalhes sobre o processamento da amostra, análise e normalização para GC-TOFMS implementadas pela instalação de núcleo escolhida ver Fiehn et al. 31 Briefly, 1 ml de solvente de extracção frio são adicionados a cada amostra, após o que as amostras são agitadas e sonicada num banho frio durante 5 minutos. As amostras são centrifugadas e, finalmente, a metade da amostra é decantado e secou-se para baixo para análise. Os extractos são purificados e com adição de marcadores de índice de retenção interna antes de ser carregado para o cromatógrafo de fase gasosa e, em seguida, subsequentemente transferido para o espectrómetro de massa. Os dados de cada amostra é analisada de modo a que as intensidades de sinal de todos os sinais detectados no cromatograma são relatados. Para a normalização, a abundância de picos para cada uma das amostras é resumida e as abundâncias totais dos picos são em média entre todas as amostras no conjunto. Abundâncias de metabolitos por amostra são divididos por pico de abundância da amostra e, em seguida, multiplicado pelo pico de abundância média do conjunto da amostra. Os dados resultantes são utilizados para a análise do metaboloma na pesquisa discutidos. Validação de metabolômica reprodutibilidade foi obrigado adeterminar o tamanho da amostra adequado para cada método de cultivo. Para detectar a precisão visto dentro das amostras e a variação observada entre tamanhos de amostra o erro padrão da média (M S), tanto para n = 3 e n = 6 conjuntos de dados foram analisados (Figura 5B). Independentemente do tamanho da amostra de cultura contínua (CC), menos de 1% dos dados teve um S M ≤ 1,5. Mediana S M S foram 221 e 300, e os valores variaram de 0-7,55 x 10 5 3,74 x 10 e 5, para n = 3 e n = 6, respectivamente. S S M foram também calculados para cada conjunto de amostra se replica no método de cultura de série (SC). Mais uma vez, menos de 1% dos dados teve um S M ≤ 1,5, um número médio de S M 137, e uma gama de 0-3,51 x 10 5. Para comparação das distribuições S m entre cada conjunto de amostras (n = 3 CC vs . CC n = 6, CC N = 3 x SC n = 3, e CC n = 6 versus SC n = 3), foi realizado um teste de permutação. O distribuição de cultura contínua ou S dos valores m conjunto de dados não era significativamente diferente da distribuição dos valores de cultura de série S M (valor de p = 0,0). No entanto, a distribuição de valores S M para cultura contínua de dados n = 3 era significativamente diferente da dos valores de S M para a cultura contínua n = 6 dados (valor de p = 1,908804 x 10 -49). Finalmente, o coeficiente de variação por metabolito foi comparado antes e depois da execução de uma etapa de garantia de qualidade (QA) (Figura 5C). No total, 210 metabolitos foram removidos após a implementação do gasoduto QA (40% dos dados). Menos de 1% dos dados removidas tinham uma abundância metabolito de zero, ~ 2% foi dados do padrão interno, ~ 5% foi a partir de dados de metabolitos nunca antes observados em E. coli, e os metabolitos restantes (> 30%) teve um coeficiente de variação maior do que 1. Tal como acontece com a análise mapas, observatio mundialns fornecida uma compreensão inicial da profundidade da informação metabolômica ofertas. Para obter uma imagem global, os clones foram hierarquicamente agrupadas com base em suas abundâncias de metabolitos relativos fornecendo informações sobre perfis de clone-metabolito, clones potenciais com funções relacionadas, e de outliers clone-metabolito (Figura 6). Para destacar as funções das proteínas, metabólitos são separadas e agrupadas com base em vias metabólicas comuns. Utilizando esta análise com resultados preliminares, foi evidente que metaboloma é capaz de separar os genes de classes diferentes (Figura 6, em destaque clones). Além disso, com a identificação de aberrações dados metaboloma foi determinada calculando pontuações normais (pontuações z) para cada par clone de metabolito. Para garantir significado estatístico, valores aberrantes foram definidos como um par clone-metabolito, com um valor de pontuação Z 2, correspondendo a apenas 5 por cento dos dados (dados não mostrados). Figura 1. Definições de classificações fenótipo. (A) Relação entre o nível de crescimento (GL) e taxa máxima de crescimento. Os pontos de dados circulado em vermelho representam as curvas de crescimento que mostram pouca ou nenhuma utilização do substrato. (B) representação Boxplot definição de limiar de crescimento com base na distribuição de curvas de crescimento com uma taxa de crescimento mínima (<0,15 OD / hr). (C) A variância eo desvio padrão de GL é calculado para substrato de D-galactose. Linhas tracejadas curtas representam dois desvios padrão de distância a partir da média. Por favor clique aqui para ver uma versão maior desta figura. highres.jpg "/> Figura 2. Os mapas de validação por meio de precisão e diferenciação. (A) curvas de crescimento de clones estruturais (cápside) e metabólicos (anotados tioredoxina), dois novos clones metabólicas (EDT2440, EDT2441), e a resposta média de clones cultivados em sacarose, D- galactose e D-manose nos mapas. As linhas azuis indicam o erro padrão visto entre dados replicados (n = 3). (B) As curvas de crescimento para 47 clones diferentes são representadas como mapas de calor para sacarose, D-galactose e D-manose. A estrutural (círculo verde) anotada e clones metabólicas (círculo laranja), dois clones metabólicas novos (círculos azuis claros e escuros), ea resposta média (círculo vermelho) são destacados. Por favor clique aqui para ver uma versão maior desta figura. pload / 52.854 / 52854fig3highres.jpg "width =" 700 "/> Figura 3. Distribuição Clone para cada fenótipo em vários substratos. A contagem de fenótipo-clone para 47 clones em 72 condições de crescimento específicas de carbono. Tabela fornece contagens directas para cada fenótipo. Por favor clique aqui para ver uma versão maior desta figura. Figura 4. Diagrama que detalha a construção do aparelho de cultura contínua. (A) passos utilizados para construir portas α-γ do reactor cultura contínua, (B) etapas utilizadas para construir a porta de fluxo para fora do reactor cultura contínua, e (C ) Os passos para construir portos δ e ε da mamadeira cultura contínua. = "Https://www.jove.com/files/ftp_upload/52854/52854fig4highres.jpg" target = "_ blank"> Clique aqui para ver uma versão maior desta figura. Figura 5. Comparação dos métodos apresentados Phenomic. (A) do fluxo de trabalho para a preparação das placas multi-fenótipo de ensaio (MAPs), culturas contínuas e de culturas em série. (B) O percentual de erro padrão da média (S M) conta tanto para n = 3 e n = 6 tamanhos de amostra para a cultura contínua (CC) e da cultura de série (SC) métodos de preparação para metabolômica. O eixo y está numa escala logarítmica. (C) As distribuições de coeficientes de variação (CV) por metabolito, antes e depois da implantação do gasoduto GQ para o método de cultura contínua (CC)."target =" _ blank g5highres.jpg "> Clique aqui para ver uma versão maior desta figura. Figura 6. Perfis metabolômico de clones crescidos em cultura contínua. As abundâncias metabolito mediana de um conjunto de metabolitos são representados por 84 clones crescidos em culturas contínuas. Perfis de metabólitos de clones anotados estruturais (capsídeo) e metabólicos (thioredoxin), dois novos clones metabólicas (EDT2440, EDT2441), ea resposta metabólica média são destacadas em vermelho. Por favor clique aqui para ver uma versão maior desta figura. Composto Carbono Azoto Enxofre Fósforo Glicerina – 0,40% 0,40% 0,40% Cloreto de amônio 9,5 mM – 9,5 mM 9,5 mM O sulfato de sódio 0,250 mM 0,250 mM – 0,250 mM O sulfato de magnésio 1,0 mM 1,0 mM – 1,0 mM Fosfato de potássio 1,32 mM 1,32 mM 1,32 mM – O cloreto de magnésio – – * – Cloreto de potássio 10 mM 10 mM 10 mM 10 mM Cloreto de cálcio 0,5 uM <td> 0,5 uM 0,5 uM 0,5 uM Cloreto de sódio 5 mM 5 mM 5 mM 5 mM Cloreto férrico 6? M 6? M 6? M 6? M L- arabinose 0,10% 0,10% 0,10% 0,10% MOPS pH 7,4 1x 1x 1x 1x Tabela 1. Os compostos e concentrações dos diferentes meios de comunicação basais utilizados nos mapas. * 1,0 mM de cloreto de magnésio é substituído. 1x MOPS = 40 mM de MOPS, Tricina 4 mm. Substratos de Carbono Substratos de nitrogênio Substratos de enxofre Psubstratos hosphorus 2 desoxi-D-ribose 2-desoxi-D-ribose Ácido 1-butano-sulfónico adenosina-5-monophoshate Ácido acético 4-hidroxi-fenil acetamida acetilcisteína beta-glicerofosfato ácido acético adenina D-cisteína creatinephosphate adenosina-5-monofosfato adenosina D-metionina D-glicose-6-fosfato adonitol alantoína dietil-ditiofosfato dietil-ditiofosfato alfa-D-glicose beta-feniletilamina DL-etionina DL-alfa-glicerofosfato alfa-D-lactose biureto glutationa fosfato de potássio alfa-D-melebiose cytidine ácido isetiónico pirofosfato de sódio ácido cítrico citosina Ácido L-cisteico tiofosfato de sódio D-alanina D-alanina L-cisteína D-arabinose D-asparagina Ácido L-djenkolic D-arabitol D-aspartato L-metionina D-asparagina D-cisteína sulfato de magnésio D-aspartato D-glucosamina ácido sulfónico metano D-cellubiose Ácido D-glutâmico N-acetil-DL-metionina D-cisteína Ácido DL-alf a-amino-n-butírico N-acetil-L-cisteína D-frutose D-metionina de potássio-tetra-thionate </tr> D-galactose D-serina tiossulfato de sódio D-glucosamina D-valina ácido sulfanic D-glicose ácido gama-amino-N-butírico taurina D-glicose-6-fosfato glicina ácido taurocólico D-glutamato guanidina tioureia D-manose histamina D-rafinose inosine D-ribose L-alanina D-salicin L-arginina D-serina L-asparagina D-trealose L-citrulina D-xilose L-cisteína dulcitol Ácido L-glutâmico glicerina L-glutamina glicina L-glutationa i-eritritol L-histidina inosine L-isoleucina L-alanina L-leucina L-arabinose L-lisina L-arabitol L-metionina L-asparagina L-ornitina L-aspartato L-fenil-alanina Ácido L-cisteico L-prolina L-cisteína Ácido L-piro-glutico L-fucose L-serina; L-treonina Ácido L-glutâmico L-triptofano L-glutamina L-valina L-isoleucina N-acetil-D-glucosamina L-leucina putrescina <tr> L-lisina tioureia L-metionina timidina L-fenilalanina timina Ácido L-piro-glutico tiramina L-ramnose tirosina L-serina uridine L-sorbose L-treonina L-triptofano L-valina L-xilose lactato lactulose malato mio-inositol ácido oxálico sorbato de potássio ácido propiónico putrescina ácido quínico piruvato de sódio succinato de sódio </td> sacarose timidina xilitol Tabela 2. Lista de substratos utilizados nos experimentos MAP.

Discussion

Aqui, apresentamos abordagens Phenomic para a caracterização funcional de genes de fago putativos. As técnicas incluem um ensaio desenvolvido capaz de metabolismo anabólico monitorização hospedeiro, as placas multi-fenótipo de ensaio (MAPs), em adição ao método estabelecido de metaboloma, capaz de efeitos no metabolismo catabólico de medição. Nós fornecemos ferramentas adicionais para gerenciar os grandes conjuntos de dados resultantes destas tecnologias, permitindo uma alta taxa de transferência de processamento e análise ^24. Por último, através da comparação de uma proteína capsídeo anotada fago, fago thioredoxin, dois genes metabólicos fagos putativos, e que a resposta experimental média propomos várias estratégias para interpretar ambos os conjuntos de dados e categorias de genes, com ênfase na identificação de tendências fenotípicas e identificação de outliers.

Como mencionado, as duas abordagens medir quantitativamente apenas metade do metabolismo de acolhimento. Para interpretar a função relativa de qualquer um dosnovas proteínas sob investigação, os dados de ambos os métodos é obrigado a fornecer provas de função. Enquanto isso não é um foco de nosso manuscrito atual, saídas de dados de cada método phenomic é colocada através de análises combinatórias que se concentram em técnicas de agrupamento, como floresta aleatório e análise de componentes principais. Além disso, as hipóteses resultantes da análise combinada deve ser posteriormente validada por metodologias genéticas tradicionais.

Finalmente, os métodos apresentados são fortemente influenciados pela fisiologia bacteriana e, portanto, seguir as mesmas normas. Ao proceder a qualquer método, considerações devem ser feitas para garantir grupos independentes, clonais são experimentadas; evite a contaminação; uma única variável está sendo testado; e controles apropriados estão sendo correu simultaneamente. A falha em conta para esses pontos irá resultar em resultados pouco claros, semelhante a qualquer ensaio fisiológico.

Multi-placas de ensaio fenótipo(Mapas)

O desenvolvimento de mapas proporciona um elevado rendimento e adaptável ensaio em comparação com as tecnologias actualmente disponíveis (Figura 5A e Tabelas 1,2). O ensaio utiliza suprimentos, equipamentos e técnicas fundamentais disponíveis em todos os laboratórios de microbiologia. A incorporação de um oleoduto computacional, PMAnalyzer ^24, para posterior processamento e análise de dados assegura uma leitura de dados rápido. Além disso, ambos os aspectos experimentais e analíticas de a abordagem pode ser facilmente ajustado ou sintonizado para fins personalizados. Por exemplo, se uma grande proporção dos dados não passar de filtragem descrito no ponto 4, pode-se peneirar manualmente através das curvas de crescimento para identificar problemas. Se o problema surge devido a rigorosos parâmetros de filtro, ajustes no script pode ser feita. Em alternativa, se os problemas estão associados com o processo experimental (isto é, a condensação prolongada; imprópria transferência de cel bacterianals, etc), então repetições adicionais podem ser facilmente repetido.

Conforme descrito na Cuevas et al. ^24, o PMAnalyzer é um único programa festança escrito como um script que executa os certificados de análise e de análise como um gasoduto coesa, automatizado. Todos os scripts são livremente acessível a partir de um repositório Git a ²⁵ por determinar o valor médio para cada ponto de tempo através de dados triplicado, e, posteriormente, parametriza a curva logística para obter o tempo de latência, taxa de crescimento máxima, asymptote, e um romance prazo, nível de crescimento. O valor médio foi escolhido em detrimento do significativo no nosso estudo para reduzir o efeito de grandes valores aberrantes, no entanto, o certificado pode ser facilmente adaptado para calcular a média de dados em duplicado. Devido à reduzida variação (SE) visto através de dados em duplicado (Figura 2A) que manteve o uso da mediana no PMAnalyzer para ajuste de uma curva logística. Além disso, o ponto de corte para o crescimento neste estudo (GL ≥ 0,4) foi determined comparando como dados separados entre nível de crescimento e taxa de crescimento máximo (Figura 1A, B). Dependendo do modelo de instrumentos e sistema utilizado este termo pode variar, requerendo redefinição deste cortado valor.

Uma grande vantagem do nosso ensaio é a capacidade para comparar fenótipos usando um único parâmetro que caracteriza o crescimento microbiano em geral, que definimos como nível de crescimento (OG). GL é uma média harmónica, e portanto mitiga os efeitos de grandes valores extremos nos dados. A utilização de uma média harmônica com os valores-equipados logísticos deslocado para fornecer um resumo de crescimento foi formada através de tentativa e erro. Outros métodos tentou diferenciar crescimento foram: tempo que levou para chegar a parâmetros específicos de curva (meia μ _max, μ _max, e capacidade de carga), o coeficiente de determinação (R ^2), e combinações de R ² multiplicado por parâmetros da curva específicos. Usando uma média harmônica com deslocouvalores logística-fit para o GL proporcionou a maior gama na avaliação de crescimento, assim, tornou-se o método de escolha. Uma consideração a ser observado é que os padrões da curva de crescimento dinâmicos têm o potencial de se perder quando se utiliza um único parâmetro ou um modelo ajustado. Por exemplo, os parâmetros da curva individuais da curva logística e GL sejam incapazes de representar crescimento bifásica. Em um ambiente único de carbono, este efeito sobre o crescimento implica mediação da proteína virai em qualquer conversão do substrato ou mudança de utilização do substrato. Efeitos adicionais potencialmente perdidos ao não considerar vários parâmetros de crescimento incluem: tempo de latência prolongada, propondo um aumento da carga de máquinas ou produtos viral; rápida aceleração fase exponencial, sugerindo proteínas virais acoplados a sediar vias de produção de energia; ou níveis mais elevados de biomassa, o que implica a formação de apoio viral no hospedeiro e a absorção de nutrientes anabolismo (dados não mostrados). Assim, traçando curvas de crescimento nascentes ( Figura 2A, B) fornece informações sobre as tendências ao longo do tempo enquanto o GL tem em conta as principais variáveis do modelo logístico, fornecendo um único número quantitativo para representar o sucesso global de um clone.

Ao considerar as diferentes respostas contribuíram por genes estruturais e metabólicas nos mapas, observa-se que as diferentes classes de substrato em questão fornece a maior evidência para a função da proteína. Por exemplo, as proteínas metabólicas são frequentemente associados com a aquisição de nutrientes limitantes, que são inespecíficos para sediar ^16,32 metabolismo central. MAP experiências preliminares revelam que os clones ancorando genes de fago metabólicas putativos têm um aumento da fase de retardamento quando cultivada em fontes de carbono metabolismo central (Figura 2A). Por outro lado, os clones portadores de genes estruturais putativas, que exigem grandes proporções de piscinas de energia anfitrião e dNTP, resultar em uma resposta falso positivo no crescimento de centosubstratos metabolismo de carbono ral e de aminoácidos. Isto é provavelmente devido à acumulação de proteínas insolúveis resultantes filamentação no hospedeiro e / ou corpos de inclusão, tal como observado por microscopia (Figura 2A e dados não mostrados). Enquanto uma análise mais aprofundada é necessária para validar estes resultados preliminares, os mapas são capazes de recuperar as respostas fenotípicas que se correlacionam com a hipótese de funções das classes de genes de fagos específicos.

Em adição para a elucidação das proteínas virais desconhecidos, os mapas são um romance recurso para investigar a diversidade funcional e metabólica de uma bactéria indivíduo ou uma comunidade de bactérias. MAP componentes são concebidos para alteração fácil de suportar o crescimento de uma gama de bactérias; incluindo marinho, auxotróficas, e os micróbios anaeróbicos. Para facilitar estes esforços a basal e pré-definido de crescimento media exigem espécies químicas adicionais ou ajustados antes de um género de bactérias diferentes podem ser apoiados nos mapas.Uma nota nesta uso dos mapas é manter a mídia definidas, que proíbe a utilização de ingredientes tais como triptona, extrato de levedura e peptona.

Metabolomics

O campo de metaboloma é dependente de bases de dados de metabolitos, que incluem metabolitos isolados identificados por espectrometria de massa. A instalação do núcleo aqui escolhido tem um dos maiores bancos de dados de metabolômica. É interessante notar que mais de metade dos metabolitos resultantes das nossas experimentações foram não identificável (~ 65%), enquanto outros nunca antes tinha sido registado na nossa hospedeiro, Escherichia coli (exemplos incluem: Indolo 3 ácido acético ^33, ácido salicílico ^34, e o ácido di-hidroabiético ^35). Este facto pode ser atribuído a qualquer uma forte tendência no sentido da base de dados de metabolitos de planta, ou as proteínas específicas em investigação. Independentemente disso, o resultado é um número limitado de metabolitos conhecidos disponíveis para a representação de dados e análise. No future, vários métodos de metabolômica usando vários bancos de dados permitiria uma maior cobertura metabolito.

Atualmente, ambos conhecidos e desconhecidos metabólitos são usados quando comparando e contrastando as nossas proteínas virais novos. Usando essa abordagem, nós supor que os clones que albergam proteínas funcionalmente semelhantes compartilharão uma maior semelhança em seu perfil metabolômica completa. Análise metaboloma preliminares revelaram que enquanto que os genes estruturais e metabólicas não se separam claramente uns dos outros, os genes que exibem efeitos semelhantes no hospedeiro quando superexpresso se correlacionam (Figura 6). Por exemplo, os agrupamentos de genes Cápside anotados em estreita colaboração com os genes metabólicos putativos destaque neste estudo, EDT2440 e EDT2441. As investigações com um programa preditor topologia transmembranar e o péptido de sinal disponíveis publicamente mostrou evidência de que ambos os genes putativos metabólicas abrigar um único domínio transmembranar. Curiosamente 5 out of the nove clones no primeiro grupo de cluster (mais à esquerda da porção de dendrograma) previram domínios de transmembrana usando o mesmo programa de topologia. Investigações adicionais são necessárias, no entanto, é provável que os metabolitos presentes durante a sobre-expressão destes clones estão associados a resposta ao stress resultante da membrana celular ou cargas estruturais. Esta evidência suporta que, embora os dados de metabolômica possui uma maior quantidade de ruído, o método é capaz de destacar os sinais que diferenciam efeitos gerais de genes, dentro e através de uma classe de genes. Para determinar se o método é capaz de extrair a informação específica da função do gene, metabolitos foram agrupados em vias metabólicas específicas. O ser hipótese, se um clone afecta metabolitos específicos para um único percurso, em seguida, o gene sobre-expresso é activa em que via. Antes da criação do nosso pipeline de garantia de qualidade metabolômica, dados preliminares revelou que mais de umd metabolitos eram tipicamente sub-representados "desconhecido", proporcionando pouca informação sobre os percursos que estão associados com (dados não mostrados). Metabolômica dados pré-processados, no entanto, revela que a maioria dos perfis de metabolitos são semelhantes e somente um número restrito de abundâncias metabolitos desconhecidos e conhecidos variar entre os clones, por exemplo, a putrescina e uracilo (Figura 6). Para proporcionar maior resolução de esforços a função da proteína são feitas experimentalmente para comparar os genes de fago contra novos genes de fago conhecidos, que podem ser utilizados para preencher os "buracos" de metabolito baseados caracterização funcional. Usando esta técnica, a função atribuída de genes virais conhecidos fornece uma referência para a função dos genes desconhecidos. No entanto, o fator limitante de análise metabolômica é o tamanho ea importância do banco de dados. Para corrigir essas limitações, bases de dados metabolômica relacionáveis a esta pesquisa precisam ser desenvolvidas; talcomo uma base de dados de metabolitos e seus abundâncias especificamente a recolha de E. ASKA Os clones de E. coli, em que um único ORF ³⁶ é sobre-expresso. Evidência para a necessidade de tais bancos de dados foi fornecido em 2013 quando pesquisadores da Lawerence Berkeley National Laboratory compilou o primeiro banco de dados abrangente de metabólitos específicos para bibliotecas inteiras de bactérias mutantes modelo ^37. Esta pesquisa forneceu novos insights sobre genes necessários para a utilização de metabólitos específicos, revelando a clara conexão entre fenótipo e genótipo.

Ao considerar metabolômica como uma ferramenta, é importante para definir o regime de processamento seguido na instalação do núcleo. Um artefacto de a maioria dos procedimentos experimentais é a variância do dia-a-dia, associada com os instrumentos de utilização. Até à data todas as análises GC-MS implementa a utilização de normas internas que estão incluídos em cada corrida analítica; no entanto, a adição de amostras internos específicos do projeto correu cada dia de experimentação remove variância adicional. Estas considerações devem ser abordadas com antecedência para evitar problemas de normalização e preconceitos. Outra solução é a processar todas as amostras em uma instalação de núcleo na mesma máquina e, como um único lote, uma opção disponível, em qualquer instalação de núcleo.

As várias ferramentas ambos introduzidos e re-explorados neste manuscrito fornecer novos meios para rastrear e caracterizar genes de fago funcionalmente desconhecidos. A simplicidade e capacidade de adaptação das técnicas experimentais com o uso de dutos agilizar computacionais garante esses métodos são aplicáveis a uma ampla gama de esforços de pesquisa e campos. Nosso objetivo é que as abordagens Phenomic apresentados aqui vai ajudar outras investigações de proteínas de fagos novos, além de sistemas que são igualmente funcionalmente indefinido.

Disclosures

The authors have nothing to disclose.

Acknowledgements

We thank Benjamin Knowles, Yan Wei Lim, Andreas Haas, and members of the Viral Dark Matter consortium for their help and constructive input on this manuscript. This research is funded by the National Science Foundation (DEB-1046413) and is part of the Dimensions: Shedding Light on Viral Dark Matter project.

Materials

0.22µm Sterivex Filter	Fisher Scientific	SVGP01050	Millipore
0.22µm Millex Filters	Fisher Scientific	SLGV033RS	Millipore
0.22µm SteriCap Filter	Fisher Scientific	SCGPS02RE	Millipore
0.22 µm Omnipore membrane filters	Millipore	JHWP02500	Millipore
96 well micro-titer plates	VWR	82050-764	Standard F-Bottom 96 well Microplates
2 mL 96 well plate	Fisher Scientific
Adhesive Seal Plate Film	Sigma-Aldrich	Z369667
2 L Nalgene square bottles	Cole Parmer	T-06040-70
125 mL Nalgene square bottles	Cole Parmer	T-06040-50
1/4inch Panel Mount Lock Nut, black nylon	Cole Parmer	EW-45509-04
Female Luer Thread Style Panel Mount to 200 Series Barb 1/16inch	Cole Parmer	EW-45500-30
Female Luer Thread Style Panel Mount to 200 Series Barb, 1/8inch	Cole Parmer	EW-45500-34
Male Luer Integral Lock Ring to 500 Series Barb, 1/16inch ID tubing	Cole Parmer	EW-45505-31
Male Luer with Lock Ring x Female Luer Coupler	Cole Parmer	T-45508-80
Barbed Bulkhead Fittings 1/4inch OD	Fisher Scientific	6149-0002
Sanipure Tubing 1/16inch ID x 1/8inch OD	SaniPure	AR400002
Sanipure Tubing 1/4inch OD x 1/8inch ID	SaniPure	AR400007
Variable Flow Mini Pump (Peristaltic pump)	Fisher Scientific	13-876-1
Magnetic Stirrer	Velp Scientifica	F203A0160
Forceps	Fisher Scientific	14-512-141	Millipore* Filter Forceps
Multi-plate spectrophotometer plate reader	Molecular Devices Analyst GT
Filter manifold	Fisher Scientific	XX10 025 02

Software:
Python version 2.7.5			http://www.python.org/
PyLab module			http://wiki.scipy.org/PyLab
R version 3.0.1			http://www.r-project.org/
reshape2 library			http://had.co.nz/reshape
ggplot2 library			http://ggplot2.org/
Gene Composer	PSI Tech Portal		http://www.genecomposer.net

Services:
West Coast Metabolomics Center	UC Davis		http://metabolomics.ucdavis.edu
DNA 2.0			https://www.dna20.com

References

Wommack, K. E., Colwell, R. R. Virioplankton: Viruses in Aquatic Ecosystems. Microbiology and Molecular Biology Reviews. 64 (1), 69-114 (2000).
Hendrix, R. W. Recoding in Bacteriophages. Recoding: Expansion of decoding rules enriches gene expression. 24, 249-258 (2010).
Breitbart, M., et al. Genomic analysis of uncultured marine viral communities. Proceedings of the National Academy of Sciences. 99 (22), 14250-14255 (2002).
Breitbart, M., et al. Diversity and population structure of a near-shore marine-sediment viral community. Proceedings. Biological sciences / The Royal Society. 271 (1539), 565-574 (2004).
Dinsdale, E. A., et al. Functional metagenomic profiling of nine biomes. Nature. 452 (7187), 629-632 (2008).
Vega Thurber, R. L., et al. Metagenomic analysis indicates that stressors induce production of herpes-like viruses in the coral Porites compressa. Proceedings of the National Academy of Sciences of the United States of America. 105 (47), 18413-18418 (2008).
Pedulla, M. L., et al. Origins of highly mosaic mycobacteriophage genomes. Cell. 113 (2), 171-182 (2003).
Calendar, R., Abedon, S. T. . The bacteriophages. , (2006).
Breitbart, M., Miyake, J. H., Rohwer, F. Global distribution of nearly identical phage-encoded DNA sequences. FEMS microbiology letters. 236 (2), 249-256 (2004).
Klenk, H. -. P., Palm, P., Zillig, W. DNA-Dependent RNA Polymerases as Phylogenetic Marker Molecules. Systematic and Applied Microbiology. 16 (4), 638-647 (1993).
Breitbart, M., Thompson, L., Suttle, C., Sullivan, M. Exploring the Vast Diversity of Marine Viruses. Oceanography. 20 (2), 135-139 (2007).
Mann, N. H., Cook, A., Millard, A., Bailey, S., Clokie, M. Marine ecosystems: bacterial photosynthesis genes in a virus. Nature. 424 (6950), 741 (2003).
Mann, N. H., et al. The genome of S-PM2, a “photosynthetic” T4-type bacteriophage that infects marine Synechococcus strains. Journal of bacteriology. 187 (9), 3188-3200 (2005).
Lindell, D., et al. Transfer of photosynthesis genes to and from Prochlorococcus viruses. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11013-11018 (2004).
Millard, A., Clokie, M. R. J., Shub, D. A., Mann, N. H. Genetic organization of the psbAD region in phages infecting marine Synechococcus strains. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11007-11012 (2004).
Sullivan, M. B., Coleman, M. L., Weigele, P., Rohwer, F., Chisholm, S. W. Three Prochlorococcus cyanophage genomes: signature features and ecological interpretations. PLoS biology. 3 (5), e144 (2005).
Rohwer, F., et al. The complete genomic sequence of the marine phage Roseophage SIOI shares homology with nonmarine phages. Limnology and Oceanography. 45 (2), 408-418 (2000).
Miller, E. S., et al. Complete genome sequence of the broad-host-range vibriophage KVP40: comparative genomics of a T4-related bacteriophage. Journal of bacteriology. 185 (17), 5220-5233 (2003).
Thompson, L. R., et al. Phage auxiliary metabolic genes and the redirection of cyanobacterial host carbon metabolism. Proceedings of the National Academy of Sciences of the United States of America. 108 (39), E757-E764 (2011).
Paterson, S., et al. Antagonistic coevolution accelerates molecular evolution. Nature. 464 (7286), 275-278 (2010).
Seguritan, V., et al. Artificial neural networks trained to detect viral and phage structural proteins. PLoS computational biology. 8 (8), e1002657 (2012).
Neidhardt, F. C., Bloch, P. L., Smith, D. F. Culture Medium for Enterobacteria. Journal of Bacteriology. 119 (3), 736-747 (1974).
Khlebnikov, A., Datsenko, K. A., Skaug, T., Wanner, B. L., Keasling, J. D. Homogeneous expression of the P(BAD) promoter in Escherichia coli by constitutive expression of the low-affinity high-capacity AraE transporter. Microbiology (Reading, England). 147 (Pt 2), 3241-3247 (2001).
Cuevas, D. A., et al. Elucidating genomic gaps using phenotypic profiles. F1000Research. , (2014).
Zwietering, M. H., Jongenburger, I., Rombouts, F. M., van’t Riet, K. Modeling of the bacterial growth curve. Applied and environmental microbiology. 56 (6), 1875-1881 (1990).
Schmieder, R., Lim, Y. W., Rohwer, F., Edwards, R. TagCleaner: Identification and removal of tag sequences from genomic and metagenomic datasets. BMC bioinformatics. 11, 341 (2010).
Schmieder, R., Edwards, R. Quality control and preprocessing of metagenomic datasets. Bioinformatics (Oxford, England). 27 (6), 863-864 (2011).
Schmieder, R., Edwards, R. Fast identification and removal of sequence contamination from genomic and metagenomic datasets. PloS One. 6 (3), e17288 (2011).
Welch, M., et al. Design parameters to control synthetic gene expression in Escherichia coli. PloS One. 4 (9), e7002 (2009).
Fiehn, O., et al. Quality control for plant metabolomics: reporting MSI-compliant studies. The Plant journal: for cell and molecular biology. 53 (4), 691-704 (2008).
Zeng, Q., Chisholm, S. W. Marine viruses exploit their host’s two-component regulatory system in response to resource limitation. Current biology: CB. 22 (2), 124-128 (2012).
Shindy, W. W., Smith, O. E. Identification of plant hormones from cotton ovules. Plant physiology. 55 (3), 550-554 (1975).
Lee, H. I., Leon, J., Raskin, I. Biosynthesis and metabolism of salicylic acid. Proceedings of the National Academy of Sciences of the United States of America. 92 (10), 4076-4079 (1995).
Chappell, J. The Biochemistry and Molecular Biology of Isoprenoid Metabolism. Plant Physiology. 107 (1), 1-6 (1995).
Kitagawa, M., et al. Complete set of ORF clones of Escherichia coli ASKA library (a complete set of E. coli K-12 ORF archive): unique resources for biological research. DNA research: an international journal for rapid publication of reports on genes and genomes. 12 (5), 291-299 (2005).
Baran, R., et al. Metabolic footprinting of mutant libraries to map metabolite utilization to genotype. ACS chemical biology. 8 (1), 189-199 (2013).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Sanchez, S. E., Cuevas, D. A., Rostron, J. E., Liang, T. Y., Pivaroff, C. G., Haynes, M. R., Nulton, J., Felts, B., Bailey, B. A., Salamon, P., Edwards, R. A., Burgin, A. B., Segall, A. M., Rohwer, F. Phage Phenomics: Physiological Approaches to Characterize Novel Viral Proteins. J. Vis. Exp. (100), e52854, doi:10.3791/52854 (2015).

Phenomics fago: Abordagens fisiológicas para Caracterizar Novel Proteínas Virais

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Phenomics fago: Abordagens fisiológicas para Caracterizar Novel Proteínas Virais

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below