$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Inicialmente, os módulos que afetam a função do biossensor devem ser selecionados para variação; isso pode incluir a regulação de proteínas de transporte, que podem afetar a concentração intracelular de ligantes e, portanto, a saída do biossensor, mas também inclui níveis relativos de transcrição e tradução do próprio aTF, bem como o repórter fluorescente ou gene de saída (Figura 1). A Figura 2 demonstra um fluxo de trabalho típico usado no desenvolvimento de um experimento baseado em DoE para otimização de biossensores; começando com a organização de elementos regulatórios em módulos distintos passíveis de manipulação via biologia sintética por meio de mudanças no nível da sequência, especificamente em locais de operadores, hexboxes ou RBS' (Figura 2A). Como tal, a próxima etapa no fluxo de trabalho do DoE é a randomização de locais de sequência para gerar bibliotecas de variantes (Figura 2B). O grau de randomização deve ser cuidadosamente considerado, pois o número de colônias rastreadas deve ser dimensionado com o grau de randomização 4N, onde N é igual ao número de posições de base aleatórias. Tratar cada promotor único ou sequência RBS como uma variável categórica única no DoE aumentaria o número de construtos necessários para níveis experimentalmente inviáveis, pois tal conversão para variáveis contínuas por meio da caracterização das bibliotecas é uma etapa de triagem necessária para avaliar a gama de funções adquiridas por meio da randomização e definir o superior, médio, médio, e limites inferiores de funcionalidade. Isso é alcançado pela primeira vez por meio da análise da produção das bibliotecas como uma medida da força do RBS ou variante promotora por meio de um gene repórter (Figura 2C). Uma transformação lin-log é realizada, como mostrado, para discretizar as variáveis contínuas em níveis que podem ser usados pelo DoE para explorar diferentes combinações e desenvolver um modelo que descreva os efeitos dessas variantes. Um projeto de triagem é então implementado usando 3 níveis que descrevem a faixa de atividade para cada fator de forma combinatória (Figura 2D). Por meio da montagem e teste dos projetos sugeridos, o espaço experimental é explorado de forma eficiente e as interações entre os fatores reveladas. A análise estatística dos dados resultantes é usada para determinar qual combinação de fatores tem o efeito mais significativo na saída do biossensor, e o SLSR é usado para prever o comportamento do sistema sob diferentes critérios, facilitando a otimização do biossensor em direção a resultados específicos, como aumento da faixa dinâmica ou sensibilidade (Figura 2D).
Figura 3 demonstra a montagem e triagem de uma biblioteca de promotores regulada por aTF. A montagem isotérmica usando um oligonucleotídeo degenerado foi realizada para criar uma biblioteca codificada por plasmídeo, em que cada plasmídeo é randomizado exclusivamente em posições específicas. O grau de diversidade da biblioteca determinará o número de colônias a serem rastreadas, com tamanhos de biblioteca teórica maiores se beneficiando muito da automação. A análise da sequência do promotor de operons homólogos ao TphR forneceu um mapa de conservação de bases que foi usado para informar os locais de randomização, especificamente bases que mostraram algum grau de variação e, portanto, podem modular a atividade sem serem absolutamente essenciais23. Três bases em cada uma das caixas hexagonais -35 e -10 foram direcionadas para randomização completa, além de seis bases no local do operador (Figura 3A), resultando em uma biblioteca teórica de promotores de ~ 500.000. A biblioteca de plasmídeos foi posteriormente usada para transformar a cepa hospedeira. Nesse estágio, uma boa eficiência de transformação é crucial para obter cobertura de biblioteca suficiente com abordagens comuns de solução de problemas mostradas em Figura 3B. A otimização das concentrações de DNA, o método de transformação e o design de clonagem podem melhorar significativamente os rendimentos do transformador. Figura 3C demonstra um fluxo de trabalho típico Ao obter transformantes, colônias individuais correspondentes a variantes únicas devem primeiro ser cultivadas em meio antes que qualquer trabalho de caracterização possa começar. Para cobrir o tamanho da biblioteca teórica, um grande número de variantes precisará ser escolhido e organizado em placas. Aproveitar sistemas automatizados, como manipuladores de líquidos e colhedores de colônias, pode banalizar essa etapa de trabalho intensivo. Passo 1 de Figura 3C ilustra a transferência de meios de crescimento em MTPs que foram carregados manualmente na doca do manipulador de líquidos, seguida de inoculação automatizada por um colhedor de colônias. Algumas etapas, como selar as placas e transferi-las para incubadoras off-line, são manuais, mas também podem ser automatizadas, se desejado. Após o crescimento das culturas, manipuladores de líquidos também podem ser usados para gerar estoques criogênicos por meio da adição de glicerol, como mostrado em Figura 3C. Nesta fase, o código de barras das placas garantirá que cada variante escolhida seja vinculada a uma placa específica e localização do poço, permitindo fácil referência para posterior caracterização a jusante. Uma das principais vantagens das abordagens automatizadas, além da redução do trabalho, é a redução do erro humano, com erros na fase de preparação da biblioteca menos propensos a serem levados adiante. Passo 2 de Figura 3C ilustra a fase de caracterização automatizada da preparação da biblioteca. Isso começa via o enchimento de DWBs com meios usando a plataforma de manipulação de líquidos, seguido de inoculação usando os estoques criogênicos com código de barras. A automação neste estágio novamente garante que os erros de pipetagem e mão de obra sejam minimizados. As placas são então seladas e transferidas manualmente para incubadoras off-line para crescimento, momento em que a disposição dos compostos efetores em placas frescas de poços profundos pode ser iniciada. Para fins de uma tela inicial de bibliotecas de peças, uma tela ON/OFF simples pode ser desejável, pois pode ser usada para pré-selecionar variantes não funcionais que exibem atividade igual ou pior do que a construção base e enriquecer o pool de variantes para aquelas que exibem atividade aprimorada. Isso tem o benefício adicional de reduzir os custos de material de pontas e placas que podem se tornar proibitivos em protocolos de triagem de grandes bibliotecas. No entanto, quando a otimização de métricas de desempenho de biossensores mais complexas é necessária (por exemplo, EC50), serão necessárias concentrações adicionais de efetores. Após o crescimento das culturas, as placas são devolvidas à plataforma de manipulação de líquidos, que começa a inocular as placas contendo compostos efetores antes de serem devolvidas manualmente à incubadora mais uma vez durante o ensaio. Figura 3D demonstra a etapa final de automação antes da coleta de dados. Após o período decorrido para crescimento e ativação do biossensor, as placas são removidas da incubadora offline e devolvidas à plataforma de manipulação de líquidos. Para remover os meios de crescimento residuais, que podem interferir na coleta de dados de fluorescência, são necessárias centrifugação, remoção do sobrenadante e lavagem das células com 1x PBS. O uso de manipuladores de líquidos pode novamente banalizar esse processo, com a ressuspensão automatizada de culturas permitindo o processamento rápido das placas, incluindo a transferência das células lavadas para MTPs de formato de 96 poços para triagem. A coleta de dados pode ser realizada de forma manual ou automatizada, com alguns leitores apresentando pilhas de placas que podem interagir com manipuladores de líquidos para automatizar ainda mais o processo de coleta de dados. Ao comparar a proporção de ativação do biossensor na presença do efetor (ON) com sua ausência (OFF), 5.000 variantes foram avaliadas usando o grau de ativação do biossensor (mudança de dobra) para determinar a função do biossensor; Apenas as variantes com atividade acima da construção base (3,6 vezes) foram levadas adiante para caracterização posterior, conforme indicado pela região sombreada vermelho-rosa do gráfico de dispersão (Figura 3D). Com base nas posições das placas e dos poços do pool de variantes enriquecido, a caracterização robusta usando réplicas biológicas ou diferentes concentrações de efetores pode ser realizada consultando-se de volta às placas crio-estoque originais com código de barras geradas na Etapa 1 do fluxo de trabalho.
A Figura 4 demonstra a triagem das variantes triadas a partir da triagem inicial da biblioteca com o objetivo de desenvolver uma biblioteca promotora para otimizar a sensibilidade. Usando os dados das 5.000 variantes rastreadas no fluxo de trabalho anterior, um pool triado de 226 variantes da tela inicial ON/OFF, determinado como mais ativo do que a sequência parental, foi então caracterizado e classificado de acordo com sua sensibilidade, a fim de atuar como níveis em torno dos quais um DSD poderia ser projetado. Como primeiro passo, as variáveis categóricas, neste caso as variantes Pout top, devem ser convertidas em variáveis contínuas que abrangem uma ampla faixa de sensibilidade. Para rastrear a sensibilidade, são necessárias curvas de resposta à dose para obter dados EC50 de uma função Hill plotada; isso aumenta drasticamente o trabalho de galvanização e é adequado para automação usando manipuladores de líquidos para simplificar o processo de configuração e triagem do ensaio, conforme mostrado na Figura 4A. Seguindo o fluxo de trabalho estabelecido na Etapa 2 da Figura 3C, códigos de barras de placas e posições de poços correspondentes ao conjunto enriquecido de variantes foram usados para inocular DWBs preenchidos com meios de crescimento e antibióticos. Para aumentar a robustez experimental, as variantes foram rastreadas em triplicata biológico. Após a transferência das placas para a incubadora off-line para crescer, os DWBs frescos foram preenchidos com meios de crescimento suplementados com efetores de 0, 1, 25 e 1000 μM usando os manipuladores de líquidos para reduzir o trabalho. Para reduzir o número de placas necessárias para o ensaio, foi escolhida uma faixa de concentração abrangendo a parte inferior, média e superior da curva, com as concentrações do ponto médio revelando as sensibilidades relativas de cada variante, conforme ilustrado na Figura 4A. Após a inoculação dos pools variantes em cada concentração efetora e análise de fluorescência e OD600, as curvas de resposta à dose foram plotadas, com análise de regressão não linear usada para determinar EC50. Nesta fase, uma biblioteca bruta de cada variante com um valor EC50 exclusivo foi gerada, com as 100 variantes mais robustas levadas adiante, conforme mostrado na Figura 4B , a fim de reduzir ainda mais o tamanho da biblioteca. Antes que essa biblioteca possa ser usada no DoE, no entanto, a conversão das variantes exclusivas em uma biblioteca classificada, representando a faixa de sensibilidade contida nela, deve ser gerada. Isso foi obtido realizando uma transformação lin-log dos dados, que classifica e redimensiona os dados para que cada variante seja classificada da mais sensível (-1) para a menos sensível (+1), bem como definindo um valor de ponto médio (0), que representa a média geométrica do conjunto de dados Figura 4C. A transformação dos dados brutos produziu o gráfico azul mostrado na Figura 4D, a partir do qual sequências discretas de Pout correspondentes a +1, 0 e -1 foram levadas para o projeto de triagem definitivo como níveis de fator de Pout .
Figura 5 demonstra o fluxo de trabalho completo após a geração da biblioteca, desde a geração do DSD até a modelagem e otimização global de um biossensor com base nos aprendizados assistidos pelo DoE. Figura 5A apresenta uma divisão de um biossensor típico em 3 módulos com 1 (módulos de transporte e regulador) ou 2 (módulo de saída) nós de regulação. Seguindo o exemplo de Figura 4, bibliotecas RBS ou promotoras terão sido desenvolvidas e níveis variando de +1, 0 e -1 selecionados para abranger a maior variação de cada fator. O tamanho das bibliotecas selecionadas normalmente determinaria o número de experimentos necessários para explorar totalmente o espaço de design, por exemplo, se cada biblioteca fosse de tamanho 22, isso equivaleria a 224 (234.256) combinações. O DoE visa simplificar a carga de trabalho experimental, reduzindo o número de combinações por meio de projetos de triagem estruturados. Embora muitas metodologias sejam possíveis, o DSD é ideal para o desenvolvimento de biossensores, pois permite a identificação de fatores principais e interações de dois fatores, evitando efeitos confusos de segunda ordem. Além disso, como os projetos DSD utilizam 3 níveis, é possível estimar a curvatura (não linearidade). Figura 5A demonstra uma saída DSD típica em que cada um dos 4 módulos é definido para níveis diferentes; como cada nível corresponde a um promotor específico ou variante RBS, a montagem isotérmica é usada para gerar as construções genéticas correspondentes aos projetos recomendados do DSD. Depois de montar e transformar a cepa hospedeira com as construções recomendadas, as curvas de resposta à dose são obtidas usando uma gama completa de concentrações efetoras para fornecer mais confiança no desempenho de cada uma das construções Figura 5B. Como o DSD reduz drasticamente o número de construções, essa etapa geralmente pode ser executada manualmente ou usando manipuladores de líquidos automatizados, se preferir. Figura 5C apresenta a saída do perfil de predição obtido após a construção e teste das combinações sugeridas a partir da tela DSD e a construção de modelos preditivos baseados no coeficiente de Hill (nH) e CE50 saída de cada combinação testada. O objetivo do experimento foi desenvolver uma construção de biossensor que fosse globalmente otimizada para nH e CE50 através da modulação da expressão dos 4 nós reguladores para maximizar ambos os parâmetros. Cada fator regulador é mostrado em sua própria coluna com o grau de expressão indicado ao longo do eixo x correspondente ao promotor transformado lin-log e às bibliotecas de peças RBS (-1 a +1). O efeito de alterar a expressão de nós em ambos os EC50 e nH é indicado pelas curvas nas subparcelas. Os gráficos de perfil destacam a natureza muitas vezes não intuitiva da otimização do biossensor, em que o ajuste de um nó regulador pode ter efeitos opostos nos parâmetros de saída. Por exemplo, EDRTrans não tem forte correlação com nH,no entanto, correlaciona-se positivamente com a CE50 de forma não linear. Interações de ordem superior (não lineares) também estão implícitas, no caso de RBSfora Um aumento na resistência aumentará a inclinação (maior nH) com um aumento concomitante da sensibilidade (menor CE50), resultando em uma curva com uma inclinação mais digital e resposta mais nítida ao aumento da concentração de efetores. A partir desses modelos, facetas não intuitivas do ajuste do biossensor podem ser renderizadas com mais clareza, o que permite a otimização dos nós de regulação em direção a um ótimo global. Os modelos foram usados para prever os ótimos globais para ambos os EC50 e nH , com as linhas vermelhas no gráfico indicando os níveis ótimos de cada nó regulador (Figura 5C). Figura 5D demonstra o perfil dose-resposta da construção inicial do biossensor parental (Azul) em comparação com o design DSD de melhor desempenho (Verde) e a construção globalmente otimizada (Lilás). Usando o modelo para prever as forças ideais do módulo para maximizar o EC50 e nH, uma variante correspondente a RBSTrans (-1), PReg (-0,7), Pfora (-0,3) e RBSfora (+1) foi montada e caracterizada com o construto otimizado mostrando melhorias no EC50 e nH (Figura 5D). Embora tanto o DSD quanto os biossensores otimizados globalmente exibam EC50 (0,8 vs 0,7 μM), nH foi significativamente melhorado sem comprometer a CE50 ganhos que já foram alcançados. Os resultados demonstram claramente as vantagens do design orientado a dados sobre as abordagens baseadas na intuição e servem para validar o DoE como um meio de agilizar e simplificar o processo de ajuste do biossensor.

Figura 1: Ajuste de parâmetros de biossensores geneticamente codificados. Layout dos módulos genéticos de um biossensor geneticamente codificado, incluindo aTF, locais do operador (OS), hexboxes (-35, -10) e componentes RBS. As caixas coloridas correspondem a interações que normalmente afetam os parâmetros do biossensor, como: afinidade ligante-aTF (cinza), operador aTF (rosa), RNAP-Hexbox (verde) e RBS (laranja). Os efeitos de cada parâmetro nas características dose-resposta são indicados nos gráficos representativos. Clique aqui para ver uma versão maior desta figura.

Figura 2: Visão geral de um fluxo de trabalho típico de otimização de biossensores DoE. (A) Visão geral da modularização dos componentes do biossensor mostrando um módulo de transporte que codifica uma proteína de transporte para importar o efetor alvo, um módulo regulador pertencente ao aTF e um módulo de saída que codifica uma proteína repórter como sfGFP. Também são mostrados nós de regulação, como RBStrans, Preg, Pout e RBSout, que correspondem aos nós genéticos que serão submetidos à randomização para explorar os parâmetros do biossensor. (B) Uma seleção de elementos de sequência passíveis de randomização de base, incluindo promotores e RBS '. A sequência parental do promotor é mostrada na linha superior, com a sequência mutante finalizada mostrada abaixo, as estrelas indicam bases inalteradas, enquanto K, M e N referem-se a guanina/timina, adenina/citosina ou qualquer nucleotídeo, respectivamente. Os promotores oferecem maior potencial de randomização por meio do direcionamento de hexboxes ou locais de operadores e também podem incluir duplicação ou modificação do espaçamento das sequências. As bibliotecas RBS oferecem opções de randomização mais limitadas, no entanto, são significativamente mais fáceis de rastrear devido à sua menor diversidade máxima. (C) Os níveis de expressão das variantes são caracterizados e, em seguida, convertidos em uma biblioteca lin-log classificada para converter os fatores de variantes categóricas em 3 níveis discretos que são mais passíveis de análise via DoE. (D) O mapeamento do espaço experimental é realizado usando combinações multiplexadas dos três níveis de cada módulo para gerar um modelo que pode ser usado para informar as escolhas de projeto para ajustar o desempenho do biossensor em direção aos resultados desejados, isso pode ser em direção à faixa dinâmica ou à sensibilidade. Clique aqui para ver uma versão maior desta figura.

Figura 3: Modularização do biossensor, construção da biblioteca do promotor e fluxo de trabalho automatizado. (A) Exemplo de randomização de sequências específicas no promotor aTF e inserção na construção do biossensor via montagem isotérmica. Letras em negrito indicam posições que foram randomizadas no local do operador ou hexboxes de acordo com a chave fornecida durante a síntese de oligonucleotídeos degenerados. (B) Painel descrevendo a transformação da biblioteca de variantes do biossensor resultante em um hospedeiro de clonagem , como E. coli, e as próximas etapas, dependendo do rendimento do transformador. A baixa eficiência de transformação pode resultar em baixa cobertura teórica da biblioteca e exploração inadequada do espaço de design. A solução de problemas neste estágio é fundamental para garantir que uma parte significativa das variantes esteja disponível para caracterização, com medidas comuns de solução de problemas descritas. (C) Fluxo de trabalho das etapas 1 e 2 conforme descrito no protocolo, com o símbolo da mão vermelha indicando etapas manuais e a engrenagem indicando etapas automatizadas. O fluxo de trabalho da etapa 1 destaca as principais etapas do protocolo, desde a seleção da colônia até a geração de estoque criogênico. O fluxo de trabalho da etapa 2 demonstra o renascimento e o rearranjo de estoques criogênicos para análise por curva de resposta à dose. (D) O painel demonstrando o procedimento final antes da triagem, incluindo a lavagem das células e a transferência para placas de ensaio antes da medição da fluorescência e do OD. Um pool de variantes rastreadas de 5000 é mostrado no painel, com as variantes demonstrando ON/OFF além da sequência do promotor parental (3,6 vezes) destacada na caixa laranja. Muitas das variantes podem ser vistas agrupadas em torno de 1, indicando baixo desempenho e baixa variabilidade, provavelmente devido à randomização no nível da sequência causando perda de função. As 226 variantes mostradas em caixa no gráfico foram levadas adiante para uma caracterização robusta. Os dados foram adaptados da publicação original de Alvarez Gonzalez et al23. Clique aqui para ver uma versão maior desta figura.

Figura 4: Triagem e discretização de variantes superiores da biblioteca do promotor por meio da transformação lin-log. (A) Esboço do procedimento padrão para gerar dados de expressão para uma EDR ou biblioteca promotora. Usando as variantes triadas que representam uma boa gama de níveis de expressão, os manipuladores de líquidos são usados para gerar placas de ensaio pré-preenchidas com concentração predeterminada de efetor a partir da qual derivar curvas de resposta à dose das 226 variantes triadas. (B) Após a determinação do EC50 e posterior redução da biblioteca caracterizada para 100 variantes, os dados são plotados como um gráfico de barras mostrando a mistura de diferentes sensibilidades geradas a partir da randomização do promotor. (C)Os dados EC50 são transformados usando a equação de taxa lin-log para converter o conjunto de dados contínuos em um conjunto categórico mais adequado para fatoração em um DSD. (D) Os dados da variante EC50 transformados são mostrados agora reduzidos a uma escala simplificada e classificados de alta a baixa atividade EC50 . A partir disso, 3 níveis correspondentes à média geométrica superior (+1) (0) e inferior (-1) Clique aqui para ver uma versão maior desta figura.

Figura 5: Projeto experimental DSD, teste e resultados de aprendizagem baseados em modelo. (A) Fluxo de trabalho esquemático mostrando a geração de uma tabela de projeto DSD com base nas bibliotecas classificadas transformadas em lin-log dos módulos RBStrans, Preg, Pout e RBSout . A tabela de projeto DSD sugere o menor número de combinações para mapear com eficiência o espaço experimental. Um exemplo de saída é fornecido em que +1, 0 e -1 se referem a variantes de desempenho superior, médio e inferior para cada nó regulatório, conforme descrito pelas transformações lin-log. Estes são construídos por meio de montagem isotérmica e confirmados por sequenciamento antes de serem transformados no hospedeiro de expressão para caracterização. (B) Após a transformação, as células são cultivadas e analisadas em relação a uma ampla gama de concentrações efetoras, e a saída fluorescente é medida para gerar curvas dose-resposta. Vários parâmetros, como nH e EC50, são extraídos das curvas dose-resposta e alimentados no DSD para gerar modelos preditivos para cada fator. (C) Usando os modelos, podem ser feitas previsões sobre o impacto da modulação de um parâmetro do biossensor por meio da alteração do nível de expressão de qualquer módulo regulatório. É importante ressaltar que o ajuste global dos nós regulatórios torna-se possível, permitindo a maximização de um ou mais parâmetros do biossensor simultaneamente, indicados pelas linhas vermelhas tracejadas em cada subparcela. (D) A otimização do modelo em direção à sensibilidade máxima resulta na construção globalmente otimizada (lilás), cuja curva de resposta à dose é plotada em relação à construção DSD de melhor desempenho (verde) e à construção do biossensor parental (azul). Os parâmetros nH e EC50 extraídos são mostrados abaixo do gráfico, demonstrando a melhoria de ambos os parâmetros acima do construto DSD de melhor desempenho, validando a eficácia dos modelos preditivos gerados a partir do DSD. Os dados foram adaptados da publicação original de Alvarez Gonzalez et al23. Clique aqui para ver uma versão maior desta figura.
Figura suplementar 1: Etapas do protocolo automatizado de manuseio de líquidos usadas para preparação da biblioteca de biossensores e configuração do ensaio. Clique aqui para baixar este arquivo.
Figura Suplementar 2 à Figura Suplementar 6: Geração passo a passo de um Projeto de Triagem Definitivo (DSD). Clique aqui para baixar este arquivo.