$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Inicialmente, los módulos que se cree que afectan la función del biosensor deben seleccionarse para variar; esto puede incluir la regulación de las proteínas de transporte, que pueden afectar la concentración intracelular de ligandos y, por lo tanto, la salida del biosensor, pero también incluye los niveles relativos de transcripción y traducción del propio aTF, así como el indicador fluorescente o el gen de salida (Figura 1). La Figura 2 muestra un flujo de trabajo típico utilizado en el desarrollo de un experimento basado en DoE para la optimización de biosensores; comenzando con la organización de elementos reguladores en distintos módulos susceptibles de manipulación a través de la biología sintética a través de cambios a nivel de secuencia, específicamente en sitios de operadores, cajas hexagonales o RBS (Figura 2A). Como tal, el siguiente paso en el flujo de trabajo de DoE es la aleatorización de sitios de secuencia para generar bibliotecas de variantes (Figura 2B). El grado de aleatorización debe considerarse cuidadosamente, ya que el número de colonias seleccionadas debe escalar con el grado de aleatorización 4N, donde N es igual al número de posiciones base aleatorizadas. Tratar cada promotor único o secuencia RBS como una variable categórica única en DoE aumentaría el número de construcciones requeridas a niveles experimentalmente inviables, ya que dicha conversión a variables continuas a través de la caracterización de las bibliotecas es un paso de clasificación necesario para medir el rango de función adquirida a través de la aleatorización y para definir la parte superior, media, y límites inferiores de funcionalidad. Esto se logra primero mediante el análisis de la producción de las bibliotecas como una medida de la fuerza de la variante RBS o promotora a través de un gen reportero (Figura 2C). Se realiza una transformación lin-log, como se muestra, para discretizar las variables continuas en niveles que pueden ser utilizados por DoE para explorar diferentes combinaciones y desarrollar un modelo que describa los efectos de estas variantes. Luego se implementa un diseño de detección utilizando 3 niveles que describen el rango de actividad para cada factor de manera combinatoria (Figura 2D). A través del ensamblaje y la prueba de los diseños sugeridos, se explora eficientemente el espacio experimental y se revelan las interacciones entre los factores. El análisis estadístico de los datos resultantes se utiliza para determinar qué combinación de factores tiene el efecto más significativo en la salida del biosensor, y SLSR se utiliza para predecir el comportamiento del sistema bajo diferentes criterios, lo que facilita la optimización del biosensor hacia resultados específicos como un mayor rango dinámico o sensibilidad (Figura 2D).
Figura 3 demuestra el ensamblaje y la selección de una biblioteca promotora regulada por aTF. Se realizó un ensamblaje isotérmico utilizando un oligonucleótido degenerado para crear una biblioteca codificada por plásmidos, mediante la cual cada plásmido se aleatoriza de forma única en posiciones específicas. El grado de diversidad de la biblioteca determinará en última instancia el número de colonias que se examinarán, y los tamaños teóricos de biblioteca más grandes se beneficiarán enormemente de la automatización. El análisis de la secuencia promotora de operones homólogos a TphR proporcionó un mapa de conservación de bases que se utilizó para informar las ubicaciones de aleatorización, específicamente las bases que mostraron cierto grado de variación y, por lo tanto, pueden modular la actividad sin ser absolutamente esenciales23. Se seleccionaron tres bases en cada una de las cajas hexagonales -35 y -10 para una aleatorización completa, además de seis bases en el sitio del operador (Figura 3A), lo que da como resultado una biblioteca de promotores teóricos de ~ 500,000. La biblioteca de plásmidos se utilizó posteriormente para transformar la cepa huésped. En esta etapa, una buena eficiencia de transformación es crucial para obtener una cobertura de biblioteca suficiente con los enfoques comunes de resolución de problemas que se muestran en Figura 3B. La optimización de las concentraciones de ADN, el método de transformación y el diseño de clonación pueden mejorar significativamente los rendimientos de los transformadores. Figura 3C Demuestra un flujo de trabajo típico Al obtener transformadores, las colonias individuales correspondientes a variantes únicas primero deben cultivarse en medios antes de que pueda comenzar cualquier trabajo de caracterización. Para cubrir el tamaño teórico de la biblioteca, será necesario seleccionar una gran cantidad de variantes y colocarlas en placas. Aprovechar los sistemas automatizados como los manipuladores de líquidos y los recolectores de colonias puede trivializar este paso que requiere mucha mano de obra. Paso 1 de Figura 3C ilustra la transferencia de medios de crecimiento a MTP que se han cargado manualmente en el muelle de manipulación de líquidos, seguida de la inoculación automatizada por parte de un recolector de colonias. Algunas etapas, como sellar las placas y transferirlas a incubadoras fuera de línea, son manuales, pero también se pueden automatizar si se desea. Tras el crecimiento de los cultivos, los manipuladores de líquidos también se pueden utilizar para generar crioexistencias mediante la adición de glicerol, como se muestra en Figura 3C. En esta etapa, el código de barras de las placas garantizará que cada variante seleccionada se vincule a una placa específica y a la ubicación del pozo, lo que permitirá una fácil referencia para una mayor caracterización posterior. Una de las principales ventajas de los enfoques automatizados, además de la reducción de la mano de obra, es la reducción del error humano, y es menos probable que se lleven a cabo errores en la etapa de preparación de la biblioteca. Paso 2 de Figura 3C ilustra la fase de caracterización automatizada de la preparación de la biblioteca. Esto comienza via el llenado de DWB con medios utilizando la plataforma de manejo de líquidos, seguido de la inoculación utilizando crio-stocks con código de barras. La automatización en esta etapa garantiza nuevamente que se minimicen los errores de pipeteo y la mano de obra. Luego, las placas se sellan y se transfieren manualmente a incubadoras fuera de línea para su crecimiento, momento en el que se puede iniciar la disposición de compuestos efectores en placas de pocillos profundos frescas. A los efectos de una pantalla inicial de bibliotecas de piezas, puede ser deseable una pantalla de ENCENDIDO/APAGADO simple, ya que se puede utilizar para preseleccionar variantes no funcionales que exhiben una actividad igual o peor que la construcción base y enriquecer el grupo de variantes para aquellas que exhiben una actividad mejorada. Esto tiene el beneficio adicional de reducir los costos de material de las puntas y las placas que pueden volverse prohibitivos en los protocolos de detección de grandes bibliotecas. Sin embargo, cuando se requiere la optimización de métricas de rendimiento de biosensores más complejas (por ejemplo, EC50), se requerirán concentraciones de efectores adicionales. Tras el crecimiento de los cultivos, las placas se devuelven a la plataforma de manipulación de líquidos, que comienza a inocular las placas que contienen compuestos efectores antes de ser devueltas manualmente a la incubadora una vez más durante la duración del ensayo. Figura 3D Muestra el paso final de la automatización antes de la recopilación de datos. Después del período transcurrido para el crecimiento y la activación del biosensor, las placas se retiran de la incubadora fuera de línea y se devuelven a la plataforma de manipulación de líquidos. Para eliminar los medios de crecimiento residuales, que pueden interferir con la recopilación de datos de fluorescencia, se requiere centrifugación, eliminación de sobrenadante y lavado de las células con 1x PBS. El uso de manipuladores de líquidos puede trivializar nuevamente este proceso, con la resuspensión automatizada de cultivos que permite un procesamiento rápido de las placas, incluida la transferencia de las células lavadas a MTP de formato de 96 pocillos para su detección. La recopilación de datos se puede realizar de forma manual o automatizada, y algunos lectores cuentan con pilas de placas que pueden interactuar con los manipuladores de líquidos para automatizar aún más el proceso de recopilación de datos. Al comparar la relación de activación del biosensor en presencia de efector (ON) con su ausencia (OFF), se evaluaron 5.000 variantes utilizando el grado de activación del biosensor (cambio de pliegue) para determinar la función del biosensor; Solo las variantes con actividad superior a la del constructo base (3,6 veces) se llevaron adelante para una mayor caracterización, como lo indica la región sombreada rojo-rosa del diagrama de dispersión (Figura 3D). Sobre la base de las posiciones de la placa y el pocillo del grupo de variantes enriquecidas, se puede llevar a cabo una caracterización robusta utilizando réplicas biológicas o diferentes concentraciones de efectores consultando las placas criogénicas originales con código de barras generadas en el Paso 1 del flujo de trabajo.
La Figura 4 demuestra el cribado de las variantes clasificadas desde el cribado inicial de la biblioteca con el objetivo de desarrollar una biblioteca promotora para optimizar la sensibilidad. Utilizando los datos de las 5.000 variantes examinadas en el flujo de trabajo anterior, un grupo de 226 variantes de la pantalla inicial de encendido / apagado, que se determinó que eran más activas que la secuencia parental, se caracterizaron y clasificaron de acuerdo con su sensibilidad, para actuar como niveles alrededor de los cuales se podría diseñar un DSD. Como primer paso, las variables categóricas, en este caso las variantes Pout top, deben convertirse en variables continuas que abarquen un amplio rango de sensibilidad. Para detectar la sensibilidad, se requieren curvas de respuesta a la dosis para obtener datos de EC50 de una función de Hill trazada; esto aumenta drásticamente el trabajo de recubrimiento y es muy adecuado para la automatización mediante manipuladores de líquidos para simplificar el proceso de configuración y cribado del ensayo, como se muestra en la Figura 4A. Siguiendo el flujo de trabajo establecido en el Paso 2 de la Figura 3C, se utilizaron códigos de barras de placas y posiciones de pocillos correspondientes al conjunto enriquecido de variantes para inocular DWB llenos de medios de crecimiento y antibióticos. Para mejorar la robustez experimental, las variantes se examinaron por triplicado biológico. Después de la transferencia de las placas a la incubadora fuera de línea para crecer, los DWB frescos se llenaron con medios de crecimiento suplementados con efectores de 0, 1, 25 y 1000 μM utilizando los manipuladores de líquidos para reducir la mano de obra. Para reducir el número de placas requeridas para el ensayo, se eligió un rango de concentración que abarca la parte inferior, media y superior de la curva, y las concentraciones del punto medio revelan las sensibilidades relativas de cada variante, como se ilustra en la Figura 4A. Después de la inoculación de los grupos variantes en cada concentración efectora y el análisis de fluorescencia y OD600, se trazaron curvas de respuesta a la dosis, con análisis de regresión no lineal utilizado para determinar EC50. En esta etapa, se generó una biblioteca sin procesar de cada variante con un valor EC50 único, con las 100 variantes más robustas como se muestra en la Figura 4B para reducir aún más el tamaño de la biblioteca. Sin embargo, antes de que esta biblioteca se pueda usar en DoE, se debe generar la conversión de las variantes únicas en una biblioteca clasificada, que represente el rango de sensibilidad que contiene. Esto se logró realizando una transformación lin-log de los datos, que clasifica y reescala los datos para que cada variante se clasifique de la más sensible (-1) a la menos sensible (+1), así como definiendo un valor de punto medio (0), que representa la media geométrica del conjunto de datos Figura 4C. La transformación de los datos brutos produjo el gráfico azul que se muestra en la Figura 4D, a partir del cual las secuencias discretas de Pde salida correspondientes a +1, 0 y -1 se llevaron al diseño de detección definitivo como niveles de factor desalida de P.
Figura 5 demuestra el flujo de trabajo completo después de la generación de la biblioteca desde la generación de DSD hasta el modelado y la optimización global de un biosensor basado en los aprendizajes asistidos por DoE. Figura 5A presenta un desglose de un biosensor típico en 3 módulos con 1 (módulos de transporte y regulador) o 2 (módulo de salida) nodos de regulación. Siguiendo el ejemplo de Figura 4, se habrán desarrollado bibliotecas RBS o promotoras, y se habrán seleccionado niveles que van desde +1, 0 y -1 para abarcar la mayor variación de cada factor. El tamaño de las bibliotecas seleccionadas normalmente determinaría el número de experimentos necesarios para explorar completamente el espacio de diseño, por ejemplo, si cada biblioteca tuviera un tamaño de 22, esto equivaldría a 224 (234,256) combinaciones. DoE tiene como objetivo simplificar la carga de trabajo experimental al reducir el número de combinaciones a través de diseños de detección estructurados. Si bien son posibles muchas metodologías, DSD es ideal para el desarrollo de biosensores, ya que permite identificar los factores principales y las interacciones de dos factores, al tiempo que evita efectos confusos de segundo orden. Además, como los diseños DSD utilizan 3 niveles, es posible estimar la curvatura (no linealidad). Figura 5A demuestra una salida DSD típica donde cada uno de los 4 módulos está configurado en diferentes niveles; como cada nivel corresponde a un promotor particular o variante de RBS, se utiliza el ensamblaje isotérmico para generar las construcciones genéticas correspondientes a los diseños recomendados del DSD. Después de ensamblar y transformar la cepa huésped con las construcciones recomendadas, se obtienen curvas de respuesta a la dosis utilizando un rango completo de concentraciones efectoras para proporcionar más confianza en el rendimiento de cada una de las construcciones Figura 5B. Como DSD reduce drásticamente el número de construcciones, este paso a menudo se puede realizar a mano o utilizando manipuladores de líquidos automatizados si se prefiere. Figura 5C presenta el resultado del perfil de predicción obtenido después de construir y probar las combinaciones sugeridas a partir de la pantalla DSD y construir modelos predictivos basados en el coeficiente de Hill (nH) y EC50 salida de cada combinación probada. El objetivo del experimento era desarrollar una construcción de biosensor que se optimizara globalmente tanto para nH y EC50 a través de la modulación de la expresión de los 4 nodos reguladores para maximizar ambos parámetros. Cada factor regulador se muestra en su propia columna con el grado de expresión indicado a lo largo del eje x correspondiente al promotor transformado lin-log y las bibliotecas de piezas RBS (-1 a +1). El efecto de cambiar la expresión de los nodos en ambos EC50 y nH se indica mediante las curvas de las subgráficas. Los gráficos de perfil destacan la naturaleza a menudo poco intuitiva de la optimización de biosensores, por lo que el ajuste de un nodo regulador puede tener efectos opuestos en los parámetros de salida. Por ejemplo, RBSTrans no tiene una correlación fuerte con nH,sin embargo, se correlaciona positivamente con la CE50 de manera no lineal. Las interacciones de orden superior (no lineales) también están implícitas, en el caso de RBSfuera Un aumento en la resistencia aumentará la pendiente (mayor nH) con un aumento concomitante de la sensibilidad (menor CE50), lo que da como resultado una curva con una pendiente más digital y una respuesta más aguda al aumento de la concentración del efector. A partir de estos modelos, las facetas poco intuitivas del ajuste de biosensores se pueden representar con mayor claridad, lo que permite la optimización de los nodos de regulación hacia un óptimo global. Los modelos se utilizaron para predecir los óptimos globales tanto para EC50 y nH , con las líneas rojas en el gráfico que indican los niveles óptimos de cada nodo regulador (Figura 5C). Figura 5D demuestra el perfil de dosis-respuesta de la construcción inicial del biosensor parental (azul) en comparación con el diseño DSD de alto rendimiento (verde) y la construcción optimizada globalmente (lila). Uso del modelo para predecir las fortalezas ideales del módulo para maximizar la EC50 y nH, avariante correspondiente a RBSTrans (-1), PReg (-0,7), Pfuera (-0,3) y RBSfuera (+1) se ensamblaron y caracterizaron con la construcción optimizada que muestra mejoras en EC50 y nH (Figura 5D). Mientras que tanto el DSD como los biosensores optimizados globalmente muestran una CE similar50 (0,8 frente a 0,7 μM), nH se mejoró significativamente sin comprometer la CE50 ganancias que ya se habían logrado. Los resultados demuestran claramente las ventajas del diseño basado en datos sobre los enfoques basados en la intuición y sirven para validar DoE como un medio para agilizar y simplificar el proceso de ajuste de biosensores.

Figura 1: Ajuste de parámetros de biosensores codificados genéticamente. Diseño de módulos genéticos de un biosensor codificado genéticamente, incluidos aTF, sitios de operador (OS), cajas hexagonales (-35, -10) y componentes RBS. Los cuadros de colores corresponden a interacciones que normalmente afectan a los parámetros del biosensor, tales como: afinidad ligando-aTF (gris), operador aTF (rosa), RNAP-Hexbox (verde) y RBS (naranja). Los efectos de cada parámetro sobre las características dosis-respuesta se indican en los gráficos representativos. Haga clic aquí para ver una versión más grande de esta figura.

Figura 2: Descripción general de un flujo de trabajo típico de optimización de biosensores DoE. (A) Descripción general de la modularización de componentes de biosensores que muestra un módulo de transporte que codifica una proteína de transporte para importar el efector objetivo, un módulo regulador perteneciente al aTF y un módulo de salida que codifica una proteína indicadora como sfGFP. También se muestran nodos de regulación, como RBStrans, Preg, Pout y RBSout, que corresponden a los nodos genéticos que se someterán a aleatorización para explorar los parámetros del biosensor. (B) Una selección de elementos de secuencia susceptibles de aleatorización de base, incluidos los promotores y RBS. La secuencia parental del promotor se muestra en la línea superior, con la secuencia mutante finalizada que se muestra a continuación, las estrellas indican bases sin cambios, mientras que K, M y N se refieren a guanina / timina, adenina / citosina o cualquier nucleótido, respectivamente. Los promotores ofrecen un mayor potencial de aleatorización al apuntar a cajas hexagonales o sitios de operadores y también pueden incluir la duplicación o la modificación del espaciado de las secuencias. Las bibliotecas RBS ofrecen opciones de aleatorización más limitadas, sin embargo, son significativamente más fáciles de filtrar debido a su menor diversidad máxima. (C) Los niveles de expresión de las variantes se caracterizan y luego se convierten en una biblioteca lin-log clasificada para convertir los factores variantes categóricos en 3 niveles discretos que son más susceptibles de análisis a través de DoE. (D) El mapeo del espacio experimental se realiza utilizando combinaciones multiplexadas de los tres niveles de cada módulo para generar un modelo que se puede usar para informar las opciones de diseño para ajustar el rendimiento del biosensor hacia los resultados deseados, esto podría ser hacia el rango dinámico o hacia la sensibilidad. Haga clic aquí para ver una versión más grande de esta figura.

Figura 3: Modularización de biosensores, construcción de bibliotecas de promotores y flujo de trabajo automatizado. (A) Ejemplo de aleatorización de secuencias específicas en el promotor aTF e inserción en la construcción del biosensor mediante ensamblaje isotérmico. Las letras en negrita indican posiciones que se aleatorizaron en el sitio del operador o en los hexboxs de acuerdo con la clave proporcionada durante la síntesis de oligonucleótidos degenerados. (B) Panel que describe la transformación de la biblioteca de variantes de biosensores resultante en un huésped clonador como E. coli, y los próximos pasos en función del rendimiento del transformador. La baja eficiencia de transformación puede resultar en una cobertura deficiente de la biblioteca teórica y una exploración inadecuada del espacio de diseño. La resolución de problemas en esta etapa es imperativa para garantizar que una parte significativa de las variantes esté disponible para la caracterización, con medidas comunes de solución de problemas descritas. (C) Flujo de trabajo de los pasos 1 y 2 como se describe en el protocolo, con el símbolo de la mano roja que indica los pasos manuales y el engranaje que indica los pasos automatizados. El flujo de trabajo del paso 1 destaca los pasos clave en el protocolo, desde la selección de colonias hasta la generación de criostocks. El flujo de trabajo del paso 2 demuestra la reactivación y el reordenamiento de crio-stocks para el ensayo por curva de respuesta a la dosis. (D) El panel que demuestra el procedimiento final antes de la selección, incluido el lavado de las células y la transferencia a las placas de ensayo antes de la medición de la fluorescencia y la OD. En el panel se muestra un grupo de variantes examinadas de 5000, con las variantes que muestran ENCENDIDO / APAGADO por encima de la secuencia promotora parental (3.6 veces) resaltada en el cuadro naranja. Se puede ver que muchas de las variantes se agrupan alrededor de 1, lo que indica un rendimiento deficiente y una baja variabilidad, probablemente debido a la aleatorización a nivel de secuencia que causa pérdida de función. Las 226 variantes que se muestran en el cuadro de la trama se llevaron adelante para una caracterización sólida. Los datos fueron adaptados de la publicación original de Álvarez González et al23. Haga clic aquí para ver una versión más grande de esta figura.

Figura 4: Cribado y discretización de variantes principales de la biblioteca promotora mediante transformación lin-log. (A) Esquema del procedimiento estándar para generar datos de expresión para una biblioteca RBS o promotora. Utilizando las variantes clasificadas que representan un buen rango de niveles de expresión, los manipuladores de líquidos se utilizan para generar placas de ensayo precargadas con una concentración predeterminada de efector a partir de las cuales derivar las curvas de respuesta a la dosis de las variantes 226 clasificadas. (B) Después de la determinación de EC50 y una mayor reducción de la biblioteca caracterizada a 100 variantes, los datos se trazan como un gráfico de barras que muestra la combinación de diferentes sensibilidades generadas a partir de la aleatorización del promotor. (C)Los datos EC50 se transforman utilizando la ecuación de velocidad lin-log para convertir el conjunto de datos continuo en uno categórico más adecuado para la factorización en un DSD. (D) Los datos de la variante EC50 transformados se muestran ahora reducidos a una escala simplificada y clasificados de alta a baja actividad EC50 . A partir de esto, se seleccionan 3 niveles correspondientes a las variantes de media geométrica superior (+1) (0) e inferior (-1) y se llevarán al DSD para explorar el espacio experimental. Haga clic aquí para ver una versión más grande de esta figura.

Figura 5: Diseño experimental DSD, pruebas y resultados de aprendizaje basados en modelos. (A) Flujo de trabajo esquemático que muestra la generación de una tabla de diseño DSD basada en las bibliotecas clasificadas transformadas lin-log de los módulos RBStrans, Preg, Pout y RBSout . La tabla de diseño DSD sugiere el menor número de combinaciones para mapear eficientemente el espacio experimental. Se proporciona un ejemplo de salida en el que +1, 0 y -1 hacen referencia a las variantes de rendimiento superior, medio e inferior para cada nodo regulador como se describe en las transformaciones lin-log. Estos se construyen mediante ensamblaje isotérmico y se confirman mediante secuenciación antes de transformarse en el huésped de expresión para su caracterización. (B) Después de la transformación, las células crecen y se analizan contra una amplia gama de concentraciones efectoras, y la salida fluorescente se mide para generar curvas de dosis-respuesta. Varios parámetros, como nH y EC50, se extraen de las curvas de dosis-respuesta y se introducen en el DSD para generar modelos predictivos para cada factor. (C) Usando los modelos, se pueden hacer predicciones sobre el impacto de modular un parámetro del biosensor mediante el cambio del nivel de expresión de cualquier módulo regulador. Es importante destacar que es posible el ajuste global de los nodos reguladores, lo que permite maximizar uno o más parámetros del biosensor simultáneamente, indicados por las líneas rojas discontinuas en cada subgráfico. (D) La optimización del modelo hacia la máxima sensibilidad da como resultado la construcción optimizada globalmente (lila), cuya curva de respuesta a la dosis se traza contra la construcción DSD de mayor rendimiento (verde) y la construcción del biosensor parental (azul). Los parámetros nH y EC50 extraídos se muestran debajo del gráfico, lo que demuestra la mejora de ambos parámetros por encima de la construcción DSD de alto rendimiento, validando la eficacia de los modelos predictivos generados a partir del DSD. Los datos fueron adaptados de la publicación original de Álvarez González et al23. Haga clic aquí para ver una versión más grande de esta figura.
Figura complementaria 1: Pasos del protocolo de manejo automatizado de líquidos utilizados para la preparación de la biblioteca de biosensores y la configuración del ensayo. Haga clic aquí para descargar este archivo.
Figura complementaria 2 a Figura complementaria 6: Generación paso a paso de un diseño de detección definitivo (DSD). Haga clic aquí para descargar este archivo.