Waiting
Processando Login

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Un flujo de trabajo para la optimización de la formulación de nanopartículas lipídicas (LNP) utilizando experimentos de proceso de mezcla diseñados y modelos de conjunto autovalidados (SVEM)

Published: August 18, 2023 doi: 10.3791/65200

Summary

Este protocolo proporciona un enfoque para la optimización de la formulación sobre los factores de estudio de mezcla, continuos y categóricos que minimiza las opciones subjetivas en la construcción del diseño experimental. Para la fase de análisis, se emplea un procedimiento de ajuste de modelado efectivo y fácil de usar.

Abstract

Presentamos un enfoque de estilo Quality by Design (QbD) para optimizar las formulaciones de nanopartículas lipídicas (LNP), con el objetivo de ofrecer a los científicos un flujo de trabajo accesible. La restricción inherente en estos estudios, donde las proporciones molares de lípidos ionizables, auxiliares y PEG deben sumar hasta el 100%, requiere métodos especializados de diseño y análisis para acomodar esta restricción de mezcla. Centrándonos en los factores lipídicos y de proceso que se utilizan comúnmente en la optimización del diseño de LNP, proporcionamos pasos que evitan muchas de las dificultades que tradicionalmente surgen en el diseño y análisis de experimentos de procesos de mezcla mediante el empleo de diseños de llenado de espacio y la utilización del marco estadístico recientemente desarrollado de modelos de conjunto autovalidados (SVEM). Además de producir formulaciones óptimas candidatas, el flujo de trabajo también crea resúmenes gráficos de los modelos estadísticos ajustados que simplifican la interpretación de los resultados. Las formulaciones candidatas recientemente identificadas se evalúan con ejecuciones de confirmación y, opcionalmente, se pueden realizar en el contexto de un estudio de segunda fase más completo.

Introduction

Las formulaciones de nanopartículas lipídicas (LNP) para sistemas de administración de genes in vivo generalmente involucran cuatro lípidos constituyentes de las categorías de lípidos ionizables, ayudantes y PEG 1,2,3. Ya sea que estos lípidos se estén estudiando solos o simultáneamente con otros factores que no son de mezcla, los experimentos para estas formulaciones requieren diseños de "mezcla" porque, dada una formulación candidata, aumentar o disminuir la proporción de cualquiera de los lípidos conduce necesariamente a una disminución o aumento correspondiente en la suma de las proporciones de los otros tres lípidos.

A modo de ejemplo, se supone que estamos optimizando una formulación de LNP que actualmente utiliza una receta establecida que se tratará como punto de referencia. El objetivo es maximizar la potencia del LNP y, secundariamente, minimizar el tamaño promedio de partícula. Los factores de estudio que varían en el experimento son las proporciones molares de los cuatro lípidos constituyentes (ionizable, colesterol, DOPE, PEG), la relación N: P, la tasa de flujo y el tipo de lípido ionizable. Los lípidos ionizables y auxiliares (incluido el colesterol) pueden variar en un rango más amplio de relación molar, 10-60%, que PEG, que variará de 1-5% en esta ilustración. La receta de formulación de referencia y los rangos de los otros factores y su granularidad de redondeo se especifican en el Archivo complementario 1. Para este ejemplo, los científicos pueden realizar 23 corridas (lotes únicos de partículas) en un solo día y les gustaría usarlo como su tamaño de muestra si cumple con los requisitos mínimos. Los resultados simulados para este experimento se proporcionan en el Archivo Suplementario 2 y el Archivo Suplementario 3.

Rampado y Peer4 han publicado un artículo de revisión reciente sobre el tema de los experimentos diseñados para la optimización de los sistemas de administración de fármacos basados en nanopartículas. Kauffman et al.5 consideraron estudios de optimización de la PNL utilizando diseños factoriales fraccionales y de cribado definitivo6; Sin embargo, estos tipos de diseños no pueden acomodar una restricción de mezcla sin recurrir al uso de "variables de holgura" ineficientes7 y no se utilizan típicamente cuando los factores de mezcla están presentes 7,8. En cambio, los "diseños óptimos" capaces de incorporar una restricción de mezcla se utilizan tradicionalmente para experimentos de proceso de mezcla9. Estos diseños se dirigen a una función especificada por el usuario de los factores de estudio y solo son óptimos (en uno de varios sentidos posibles) si esta función captura la verdadera relación entre los factores de estudio y las respuestas. Obsérvese que en el texto hay una distinción entre "diseños óptimos" y "candidatos a formulación óptima", y este último se refiere a las mejores formulaciones identificadas por un modelo estadístico. Los diseños óptimos vienen con tres desventajas principales para los experimentos de proceso de mezcla. Primero, si el científico no anticipa una interacción de los factores del estudio al especificar el modelo objetivo, entonces el modelo resultante estará sesgado y puede producir formulaciones candidatas inferiores. En segundo lugar, los diseños óptimos colocan la mayoría de las ejecuciones en el límite exterior del espacio factorial. En los estudios de LNP, esto puede conducir a un gran número de corridas perdidas si las partículas no se forman correctamente en ningún extremo de los lípidos o configuraciones de proceso. En tercer lugar, los científicos a menudo prefieren tener ejecuciones experimentales en el interior del espacio factorial para obtener un sentido independiente del modelo de la superficie de respuesta y observar el proceso directamente en regiones previamente inexploradas del espacio factorial.

Un principio de diseño alternativo es apuntar a una cobertura uniforme aproximada del espacio factorial (restringido por mezcla) con un diseño que llene el espacio10. Estos diseños sacrifican cierta eficiencia experimental en relación con los diseños óptimos9 (suponiendo que todo el espacio factorial conduce a formulaciones válidas) pero presentan varios beneficios en una compensación que son útiles en esta aplicación. El diseño de relleno de espacio no hace ninguna suposición a priori sobre la estructura de la superficie de respuesta; Esto le da la flexibilidad para capturar relaciones imprevistas entre los factores de estudio. Esto también agiliza la generación de diseño porque no requiere tomar decisiones sobre qué términos de regresión agregar o quitar a medida que se ajusta el tamaño de ejecución deseado. Cuando algunos puntos de diseño (recetas) conducen a formulaciones fallidas, los diseños que llenan el espacio permiten modelar el límite de falla sobre los factores de estudio al tiempo que respaldan modelos estadísticos para las respuestas del estudio sobre las combinaciones de factores exitosas. Finalmente, la cobertura interior del espacio factorial permite la exploración gráfica independiente del modelo de la superficie de respuesta.

Para visualizar el subespacio del factor de mezcla de un experimento de proceso de mezcla, se utilizan "gráficas ternarias" triangulares especializadas. La figura 1 motiva este uso: en el cubo de puntos donde se permite que tres ingredientes oscilen entre 0 y 1, los puntos que satisfacen una restricción de que la suma de los ingredientes es igual a 1 se resaltan en rojo. La restricción de mezcla en los tres ingredientes reduce el espacio factorial factible a un triángulo. En aplicaciones de LNP con cuatro ingredientes de mezcla, producimos seis gráficos ternarios diferentes para representar el espacio factorial trazando dos lípidos a la vez contra un eje "Otros" que representa la suma de los otros lípidos.

Figure 1
Figura 1: Regiones de factor triangular. En la gráfica de relleno de espacio dentro del cubo, los pequeños puntos grises representan formulaciones que son inconsistentes con la restricción de mezcla. Los puntos rojos más grandes se encuentran en un triángulo inscrito dentro del cubo y representan formulaciones para las cuales se satisface la restricción de mezcla. Haga clic aquí para ver una versión más grande de esta figura.

Además de los factores de mezcla de lípidos, a menudo hay uno o más factores de proceso continuos, como la relación N: P, la concentración de tampón o la velocidad de flujo. Los factores categóricos pueden estar presentes, como el tipo de lípido ionizable, el tipo de lípido ayudante o el tipo de tampón. El objetivo es encontrar una formulación (una mezcla de lípidos y ajustes para factores de proceso) que maximice alguna medida de potencia y / o mejore las características fisicoquímicas, como minimizar el tamaño de partícula y PDI (índice de polidispersidad), maximizar la encapsulación porcentual y minimizar los efectos secundarios, como la pérdida de peso corporal, en estudios in vivo . Incluso cuando se parte de una receta de referencia razonable, puede haber interés en volver a optimizar dado un cambio en la carga útil genética o al considerar cambios en los factores de proceso o tipos de lípidos.

Cornell7 proporciona un texto definitivo sobre los aspectos estadísticos de los experimentos de mezcla y proceso de mezcla, con Myers et al.9 proporcionando un excelente resumen de los temas de diseño y análisis de mezclas más relevantes para la optimización. Sin embargo, estos trabajos pueden sobrecargar a los científicos con detalles estadísticos y con terminología especializada. El software moderno para el diseño y análisis de experimentos proporciona una solución robusta que soportará suficientemente la mayoría de los problemas de optimización de LNP sin tener que apelar a la teoría relevante. Si bien los estudios más complicados o de alta prioridad aún se beneficiarán de la colaboración con un estadístico y pueden emplear diseños óptimos en lugar de llenar el espacio, nuestro objetivo es mejorar el nivel de comodidad de los científicos y fomentar la optimización de las formulaciones de LNP sin apelar a pruebas ineficientes de un factor a la vez (OFAT)11 o simplemente conformarse con la primera formulación que satisfaga las especificaciones.

En este artículo, se presenta un flujo de trabajo que utiliza software estadístico para optimizar un problema genérico de formulación de LNP, abordando problemas de diseño y análisis en el orden en que se encontrarán. De hecho, el método funcionará para problemas generales de optimización y no se limita a los LNP. En el camino, se abordan varias preguntas comunes que surgen y se proporcionan recomendaciones que se basan en la experiencia y en los resultados de la simulación12. El marco recientemente desarrollado de modelos de conjunto autovalidados (SVEM)13 ha mejorado enormemente el enfoque frágil para analizar los resultados de los experimentos de procesos de mezcla, y utilizamos este enfoque para proporcionar una estrategia simplificada para la optimización de la formulación. Si bien el flujo de trabajo se construye de una manera general que podría seguirse utilizando otros paquetes de software, JMP 17 Pro es único en ofrecer SVEM junto con las herramientas de resumen gráfico que hemos encontrado necesarias para simplificar el análisis arcano de los experimentos de procesos de mezcla. Como resultado, también se proporcionan instrucciones específicas de JMP en el protocolo.

SVEM emplea la misma base del modelo de regresión lineal que el enfoque tradicional, pero nos permite evitar modificaciones tediosas que se requieren para ajustarse a un "modelo completo" de efectos candidatos mediante el uso de un enfoque base de selección directa o selección penalizada (Lazo). Además, SVEM proporciona un ajuste mejorado de "modelo reducido" que minimiza el potencial de incorporación de ruido (proceso más varianza analítica) que aparece en los datos. Funciona promediando los modelos predichos resultantes de reponderar repetidamente la importancia relativa de cada ejecución en el modelo 13,14,15,16,17,18. SVEM proporciona un marco para modelar experimentos de mezcla-proceso que es más fácil de implementar que la regresión tradicional de un solo disparo y produce candidatos de formulación óptima de mejor calidad12,13. Los detalles matemáticos de SVEM están más allá del alcance de este documento e incluso un resumen superficial más allá de la revisión de la literatura relevante distraería de su principal ventaja en esta aplicación: permite un procedimiento de hacer clic para ejecutar simple, robusto y preciso para los profesionales.

El flujo de trabajo presentado es consistente con el enfoque de Calidad por Diseño (QbD)19 para el desarrollo farmacéutico20. El resultado del estudio será una comprensión de la relación funcional que vincula los atributos materiales y los parámetros del proceso con los atributos críticos de calidad (CQAs)21. Daniel et al.22 discuten el uso de un marco QbD específicamente para la producción de plataformas de ARN: nuestro flujo de trabajo podría usarse como una herramienta dentro de este marco.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

El experimento descrito en la sección Resultados Representativos se llevó a cabo de acuerdo con la Guía para el Cuidado y Uso de Animales de Laboratorio y los procedimientos se realizaron siguiendo las pautas establecidas por nuestro Comité Institucional de Cuidado y Uso de Animales (IACUC). Se obtuvieron comercialmente ratones hembra Balb/C de 6-8 semanas de edad. Los animales recibieron comida y agua estándar ad libitum y fueron alojados en condiciones estándar con ciclos de luz / oscuridad de 12 horas, a una temperatura de 65-75 ° F (~ 18-23 ° C) con 40-60% de humedad.

1. Registrar el propósito del estudio, las respuestas y los factores

NOTA: A lo largo de este protocolo, JMP 17 Pro se utiliza para diseñar y analizar el experimento. Se puede usar software equivalente siguiendo pasos similares. Para obtener ejemplos e instrucciones adicionales para todos los pasos realizados en la Sección 1, consulte el Archivo complementario 1.

  1. Resuma el propósito del experimento en un documento con fecha y fecha.
  2. Enumere las respuestas primarias (CQA) que se medirán durante el experimento.
  3. Enumere cualquier respuesta secundaria (por ejemplo, restricciones posteriores sobre las propiedades fisicoquímicas) que puedan medirse.
  4. Enumere los parámetros del proceso que pueden estar relacionados con las respuestas, incluidos los que son más relevantes para el propósito del estudio.
  5. Si el estudio se ejecutará durante varios días, incluya un factor de "bloqueo" categórico del día.
    NOTA: Esto equilibra la configuración de factores a través de días para evitar que los cambios a nivel de día en la media del proceso se confundan con los factores de estudio.
  6. Seleccionar los factores que se variarán y los que se mantendrán constantes durante el estudio.
    NOTA: Utilice herramientas de priorización de riesgos como los análisis de efectos de modo de falla20 para seleccionar el subconjunto de factores más relevante (Figura 2). Por lo general, se debe permitir que todos los lípidos varíen; aunque en algunos casos con limitaciones presupuestarias, es razonable bloquear PEG en una proporción fija.
  7. Establezca los rangos para los factores variables y la precisión decimal relevante para cada uno.
  8. Decida el tamaño del diseño del estudio (el número de lotes únicos de partículas) utilizando la heurística mínima y máxima. Las ejecuciones de referencia de control incluidas manualmente no cuentan para el tamaño de ejecución recomendado por la heurística.
    NOTA: La siguiente heurística asume que las respuestas son continuas. La heurística mínima asume que será posible realizar un estudio de seguimiento, si es necesario, además de realizar ejecuciones de confirmación para formulaciones óptimas candidatas. Si solo será factible realizar ejecuciones de confirmación, entonces es mejor presupuestar el número de ejecuciones obtenidas de la heurística máxima. Para las respuestas primarias binarias, busque ayuda de un estadístico para determinar el número apropiado de ejecuciones.
    1. Heurística mínima: Asigne tres ejecuciones por factor de mezcla, dos por factor de proceso continuo y uno por nivel de cada factor categórico.
      NOTA: Para un estudio con cuatro factores lipídicos, dos continuos y una variable de proceso categórico de tres vías, esto lleva a una sugerencia de (3 x 4) + (2 x 2) + 3 = 19 corridas de llenado de espacio. Agregue ejecuciones adicionales si es probable que algunas fallen debido a problemas de formulación o medición.
    2. Heurística máxima: Inicie el software para crear diseños óptimos e ingrese los parámetros requeridos para un segundo orden (incluidos los efectos principales, las interacciones bidireccionales entre todos los efectos y los efectos cuadráticos para los factores de proceso continuos). Calcule el tamaño mínimo de ejecución según el algoritmo del software. Agregue 1 al resultado obtenido del software para definir la heurística máxima.
      NOTA: Consulte el Archivo complementario 1 para obtener instrucciones detalladas sobre cómo realizar estos pasos. Un caso de muestra con cuatro factores lipídicos, dos continuos y uno de proceso categórico de tres vías, conduce a un tamaño de ejecución recomendado de 34 (33 de la recomendación del software + 1). Cualquier carrera más allá de esto probablemente se usaría mejor para estudios de confirmación o seguimiento.

Figure 2
Figura 2: Diagrama de causa y efecto. El diagrama muestra factores comunes en un problema de optimización de la formulación de LNP. Haga clic aquí para ver una versión más grande de esta figura.

2. Creación de la mesa de diseño con un diseño que llena el espacio

  1. Abra JMP y navegue por la barra de menús hasta DOE > Diseño de relleno de espacio > de propósito especial.
  2. Introduzca las respuestas del estudio (véase el archivo complementario 1).
  3. Opcional: agregue columnas para respuestas adicionales, indicando si cada una debe maximizarse, minimizarse o dirigirse haciendo clic en Agregar respuesta.
    NOTA: Esta configuración se puede modificar más adelante y no afecta al diseño. Del mismo modo, se pueden agregar columnas adicionales para respuestas adicionales después de crear la tabla de diseño.
  4. Introduzca los factores de estudio y los rangos correspondientes. Utilice el botón Mezcla para agregar factores de mezcla, el botón Continuo para agregar factores continuos o el botón Categórico para agregar factores categóricos.
    NOTA: Este estudio de ejemplo utiliza los factores y rangos ilustrados en la Figura 3, que incluyen la relación molar ionizable (que oscila entre 0.1 y 0.6), la relación molar auxiliar (también entre 0.1 y 0.6), la relación molar colesterol (entre 0.1 y 0.6), la relación molar PEG (de 0.01 a 0.05) y el tipo de lípido ionizable (que puede ser H101, H102 o H103).
  5. Introduzca el número predeterminado de ejecuciones para el diseño en el campo Número de ejecuciones .
  6. Opcional: Aumente el tamaño medio del clúster del valor predeterminado de 50 a 2000 mediante el menú del triángulo rojo situado junto al encabezado Diseño de relleno de espacio y en el submenú Opciones avanzadas .
    NOTA: Esta es una configuración para el algoritmo de relleno de espacio que puede conducir a una construcción de diseño ligeramente mejor a costa de tiempo computacional adicional.
  7. Genere la tabla de diseño de relleno de espacio para los factores elegidos y el tamaño de ejecución. Haga clic en Relleno flexible rápido y, a continuación, haga clic en Crear tabla.
    NOTA: Las dos primeras ejecuciones de un diseño de ejemplo se muestran en la figura 4.
  8. Agregue una columna Notas a la tabla para anotar las ejecuciones creadas manualmente. Haga doble clic en el primer encabezado de columna vacío para agregar una columna y, a continuación, haga doble clic en el nuevo encabezado de columna para editar el nombre.
  9. Si procede, incorpore manualmente ejecuciones de control de referencia en la tabla de diseño. Incluya una réplica para uno de los puntos de referencia de control. Marque el nombre del punto de referencia en la columna Notas y codifique con colores las filas de replicación del punto de referencia para facilitar la identificación del gráfico.
    1. Agregue una nueva fila haciendo doble clic en el primer encabezado de fila vacío e ingrese la configuración del factor de referencia. Duplique esta fila para crear una réplica del punto de referencia. Resalte ambas filas y navegue hasta Filas > colores para asignar un color con fines gráficos.
      NOTA: La réplica proporciona una estimación independiente del modelo del proceso más la varianza analítica y proporcionará información gráfica adicional.
  10. Si alguna ejecución de control de referencia excede el rango de los factores de estudio, indíquelo en la columna "Notas" para su futura exclusión del análisis.
  11. Redondee los factores de mezcla a la granularidad adecuada. Para ello,
    1. Resalte los encabezados de columna de los factores de mezcla, haga clic con el botón secundario en uno de los encabezados de columna y navegue hasta Nueva columna de fórmula > Transformar > ronda..., introduzca el intervalo de redondeo correcto y haga clic en Aceptar.
    2. Asegúrese de que no haya filas seleccionadas haciendo clic en el triángulo inferior en la intersección de los encabezados de fila y columna.
    3. Copie los valores de las columnas redondeadas recién creadas (Ctrl + C) y péguelos (Ctrl + V) en las columnas de mezcla originales. Por último, elimine las columnas de valores redondeados temporales.
  12. Después de redondear las proporciones de lípidos, verifique que su suma sea igual al 100% seleccionando los encabezados de columna para los factores de mezcla, haciendo clic con el botón derecho en uno y yendo a Nueva columna de fórmula > Combinar > suma. Si la suma de cualquier fila no es igual a 1, ajuste manualmente uno de los factores de mezcla, asegurándose de que la configuración del factor permanezca dentro del rango de factores. Elimine la columna de suma después de realizar los ajustes.
  13. Siga el mismo procedimiento utilizado para redondear los factores de mezcla para redondear los factores de proceso a su respectiva granularidad.
  14. Formatee las columnas de lípidos para que se muestren como porcentajes con el número deseado de decimales: seleccione los encabezados de columna, haga clic con el botón derecho y elija Estandarizar atributos.... En la siguiente ventana, establezca Formato en Porcentaje y ajuste el número de decimales según sea necesario.
  15. Si se agregan ejecuciones manuales, como puntos de referencia, vuelva a aleatorizar el orden de las filas de la tabla: agregue una nueva columna con valores aleatorios (haga clic con el botón derecho en el encabezado de la última columna y seleccione Nueva columna de fórmula > Aleatorio > Normal aleatorio). Ordene esta columna en orden ascendente haciendo clic con el botón secundario en su encabezado de columna y, a continuación, elimine la columna.
  16. Opcional: agregue una columna Run ID . Rellene esto con la fecha actual, el nombre del experimento y el número de fila de la tabla.
    NOTA: Consulte (Figura 5) para ver un ejemplo.
  17. Generar gráficos ternarios para visualizar los puntos de diseño sobre los factores lipídicos (Figura 6). Además, examine la distribución de ejecución sobre los factores de proceso (Figura 7): seleccione Gráfico > Gráfico ternario. Seleccione sólo los factores de mezcla para X, Trazado.
  18. Para examinar la distribución sobre los factores de proceso, seleccione Analizar > distribución e introduzca los factores de proceso para Y, Columnas.
    NOTA: El científico de formulación debe confirmar la viabilidad de todas las corridas. Si existen ejecuciones inviables, reinicie el diseño teniendo en cuenta las restricciones recién descubiertas.

Figure 3
Figura 3: Factores y rangos de estudio. Las capturas de pantalla de la configuración dentro del software experimental son útiles para reproducir la configuración del estudio. Haga clic aquí para ver una versión más grande de esta figura.

Figure 4
Figura 4: Salida inicial para un diseño de relleno de espacio. Al mostrar las dos primeras filas de la tabla, los ajustes deben redondearse a la precisión deseada y al mismo tiempo asegurarse de que las cantidades de lípidos sumen 1. El punto de referencia se agregó a la tabla manualmente. Haga clic aquí para ver una versión más grande de esta figura.

Figure 5
Figura 5: Tabla de estudio formateada. Los niveles de factor se han redondeado y formateado y se ha agregado una columna de ID de ejecución. Haga clic aquí para ver una versión más grande de esta figura.

Figure 6
Figura 6: Puntos de diseño en una gráfica ternaria. Las 23 formulaciones se muestran en función de las correspondientes proporciones Ionizable, Ayudante y "Otros" (Colesterol + PEG). El punto verde en el centro representa la relación molar de referencia 33:33:33:1 de Ionizable (H101):Colesterol:Ayudante (DOPE):P EG. Haga clic aquí para ver una versión más grande de esta figura.

Figure 7
Figura 7: Distribución de factores de proceso sin mezcla en el experimento. Los histogramas muestran cómo las ejecuciones experimentales están espaciadas a través del tipo de lípido ionizable, la relación N: P y la tasa de flujo. Haga clic aquí para ver una versión más grande de esta figura.

3. Ejecución del experimento

  1. Ejecute el experimento en el orden proporcionado por la tabla de diseño. Registre las lecturas en las columnas integradas en la tabla experimental.
  2. Si se realizan varios ensayos para la misma respuesta en un lote de formulación idéntico, calcule un promedio para estos resultados dentro de cada lote. Agregue una columna para cada medición de ensayo a la tabla.
    1. Para obtener un promedio, seleccione todas las columnas relacionadas, haga clic con el botón derecho en uno de los encabezados de columna seleccionados y elija Nueva columna de fórmula > Combinar > promedio. Utilice esta columna Promedio para futuros análisis de respuestas.
      NOTA: Sin comenzar la receta de nuevo, las mediciones repetidas del ensayo solo capturan la varianza del ensayo y no constituyen réplicas independientes.
  3. Documente cualquier ocurrencia de precipitación de formulación o problemas de tolerabilidad in vivo (como pérdida severa de peso corporal o muerte) con indicadores binarios (0/1) en una nueva columna para cada tipo de problema.

4. Análisis de los resultados experimentales

  1. Trazar las lecturas y examinar las distribuciones de las respuestas: abra Graph > Graph Builder y arrastre cada respuesta al área Y para gráficos individuales. Repita esto para todas las respuestas.
  2. Examine la distancia relativa entre las ejecuciones de réplica codificadas por colores, si se incluyó una. Esto permite la comprensión de la variación total (proceso y analítica) en el punto de referencia en comparación con la variabilidad debida a los cambios en la configuración de factores en todo el espacio factorial (Figura 8).
  3. Determine si se debe modelar la respuesta sin procesar o si se debe usar una transformación en su lugar. Para las respuestas que están restringidas a ser positivas pero que no están acotadas anteriormente (por ejemplo, potencia), ajuste tanto una distribución normal como una distribución lognormal a los resultados experimentales. Si la distribución lognormal encaja mejor con un AICc más bajo (criterio de información de Akaike corregido), entonces tome una transformación logarítmica de esa respuesta.
    1. Vaya a Analizar distribución > y seleccione la respuesta para Y, Columnas. En el informe de distribución resultante, haga clic en el triángulo rojo situado junto al nombre de la respuesta y elija Ajuste continuo > Ajuste normal y Ajuste continuo > Ajustar lognormal en el menú desplegable. En el siguiente informe Comparar distribuciones, compruebe los valores de AICc para determinar qué distribución se ajusta mejor a la respuesta.
    2. Para realizar una transformación de registro, haga clic con el botón secundario en el encabezado de la columna de respuesta y seleccione Nueva columna de fórmula > Registro > registro. Cuando se genera un modelo y se guarda una columna de predicción en la escala logarítmica, transforme la respuesta de nuevo a la escala original seleccionando Nueva columna de fórmula > Registro > Exp.
    3. Para respuestas de proporción acotadas entre 0 y 1, compare el ajuste de una distribución normal y beta. Si la distribución beta tiene un AICc inferior, realice una transformación logit. En el informe Distribución de la respuesta, elija Ajuste continuo > Ajuste normal y Ajuste continuo > Ajuste beta.
      1. Para la transformación logit, haga clic con el botón secundario en el encabezado de la columna de respuesta de la tabla de datos y seleccione Nueva columna de fórmula > Especialidad > Logit. Publicar la creación de modelos, guarde la columna de predicción. Para volver a la escala original, utilice Nueva columna de fórmula > Especialidad > logística.
        NOTA: El análisis SVEM basado en regresión es robusto a las desviaciones de la normalidad en la distribución de la respuesta. Sin embargo, estas transformaciones pueden conducir a una interpretación más fácil de los resultados y a un mejor ajuste de los modelos.
  4. Grafique las ejecuciones en una gráfica ternaria. Colorea los puntos según las respuestas (o las respuestas transformadas si se aplicó una transformación): abre Gráfico > Gráfico ternario. Seleccione sólo los factores de mezcla para X, Trazado. Haga clic con el botón derecho en cualquiera de los gráficos resultantes, seleccione Leyenda de fila y, a continuación, seleccione la columna de respuesta (transformada).
    NOTA: Colorear los puntos de acuerdo con las respuestas proporciona una perspectiva visual independiente del modelo del comportamiento en relación con los factores de mezcla.
  5. Elimine el script de modelo generado por el diseño de relleno de espacio.
  6. Construir un modelo independiente para cada respuesta en función de los factores de estudio, repitiendo los siguientes pasos para cada respuesta.
    NOTA: En el caso de una respuesta binaria secundaria (por ejemplo, falla de formulación o muerte del ratón), modele también esta respuesta. Cambie la configuración de distribución de destino de Normal a Binomio.
  7. Construir un modelo "completo" que comprenda todos los efectos candidatos. Este modelo debe incluir los principales efectos de cada factor, interacciones bidireccionales y tridireccionales, términos cúbicos cuadráticos y parciales en los factores de proceso, y términos cúbicos de Scheffé para los factores de mezcla23,24.
    NOTA: Utilice el mismo conjunto de efectos candidatos para cada respuesta. La técnica de selección de modelos SVEM refinará independientemente los modelos para cada respuesta, lo que podría resultar en modelos reducidos únicos para cada uno. La figura 9 ilustra algunos de estos efectos candidatos. Los siguientes subpasos detallan este proceso.
    1. Seleccione Analizar > modelo de ajuste.
    2. Asegúrese de que los factores de bloqueo (p. ej., Día) no puedan interactuar con otros factores del estudio. Seleccione cualquier factor de bloqueo y haga clic en Agregar. No incluya estos factores en ninguno de los subpasos posteriores.
      NOTA: Es importante tener en cuenta los factores de bloqueo en el modelo, pero no se debe permitir que los factores de bloqueo interactúen con otros factores del estudio. El objetivo principal de los factores de bloqueo es ayudar a controlar la variabilidad del experimento y mejorar la sensibilidad del experimento.
    3. Destaque todos los factores del estudio. Modifique el valor del campo Grado en 3 (se establece en 2 de forma predeterminada). Haga clic en Factorial to Degree.
      NOTA: Esta acción incluye efectos principales, así como interacciones bidireccionales y tridireccionales en el modelo.
    4. Seleccione sólo los factores que no sean de mezcla en la ventana de selección. Haga clic en Macros > Cúbico parcial.
      NOTA: Esta acción introduce efectos cuadráticos para los factores de proceso continuo y su interacción con otros factores no mixtos en el modelo.
    5. Elija solo los factores de mezcla de la lista de selección. Haga clic en Macros > Scheffe Cubic. Desactive la opción predeterminada Sin intercepción (consulte la figura 9).
      NOTA: Incluir una intercepción en el modelo es un paso esencial cuando se utilizan métodos Lasso y también es útil en el contexto de la selección directa. La configuración predeterminada tradicional Sin intercepción suele estar en su lugar porque ajustar una intercepción simultáneamente con todos los efectos principales de la mezcla, sin modificaciones como el enfoque SVEM, no es factible con el procedimiento regular de regresión de mínimos cuadrados12.
    6. Especifique la columna de respuesta: resalte la columna de respuesta y haga clic en Y.
    7. Cambie la configuración de Personalidad a Regresión generalizada. Mantenga Distribución establecida en Normal.
    8. Guarde esta configuración de modelo en la tabla de datos para usarla con respuestas adicionales haciendo clic en el menú del triángulo rojo junto a Especificación del modelo y seleccionando Guardar en tabla de datos.
  8. Aplique el método de selección directa SVEM para ajustarse al modelo reducido, sin la inclusión obligatoria de los efectos principales del factor de mezcla, y almacene la columna de la fórmula de predicción en la tabla de datos.
    1. En el cuadro de diálogo Ajustar modelo , haga clic en Ejecutar.
    2. Para el Método de estimación, seleccione SVEM Forward Selection (Selección de reenvío de SVEM).
    3. Expanda los menús Controles avanzados > Términos forzados y anule la selección de las casillas asociadas con los efectos principales de la mezcla. Solo la casilla Interceptar término debe permanecer marcada. La figura 10 muestra la configuración predeterminada donde se fuerzan los efectos principales. Para este paso, estas casillas deben desmarcarse para permitir que el modelo incluya o excluya estos efectos en función del procedimiento de selección directa.
    4. Haga clic en Ir para ejecutar el procedimiento SVEM Forward Selection.
  9. Trazar las respuestas reales por las respuestas predichas del modelo SVEM para verificar una capacidad predictiva razonable. (Figura 11). Haga clic en el triángulo rojo junto a Selección directa SVEM y seleccione Gráficas de diagnóstico > Gráfica real por prevista.
  10. Haga clic en el triángulo rojo situado junto a Selección directa de SVEM y seleccione Guardar columnas > Guardar fórmula de predicción para crear una nueva columna que contenga la fórmula de predicción en la tabla de datos.
  11. Opcional: Repita los pasos anteriores utilizando SVEM Lasso como método de estimación para determinar si se sugiere una receta óptima diferente después de realizar los pasos siguientes. Si es así, ejecute ambas recetas como ejecuciones de confirmación (discutidas en la Sección 5) para ver cuál funciona mejor en la práctica12.
  12. Repita los pasos de creación de modelos para cada respuesta.
  13. Una vez guardadas las columnas de predicción para todas las respuestas en la tabla de datos, grafique los seguimientos de respuesta para todas las columnas de respuesta previstas mediante la plataforma Generador de perfiles: seleccione Gráfico > Generador de perfiles, seleccione todas las columnas de predicción creadas en el paso anterior para Y, Fórmula de predicción, y haga clic en Aceptar (Figura 12).
  14. Identificar la(s) formulación(es) óptima(s) candidata(s).
    1. Defina la "función de deseabilidad" para cada respuesta, especificando si la respuesta debe maximizarse, minimizarse o coincidir con un objetivo. Establezca cualquier respuesta primaria para usar un peso de importancia de 1.0 y cualquier respuesta secundaria para usar un peso de importancia de 0.2. En el menú del triángulo rojo del generador de perfiles de predicción, seleccione Optimización y deseabilidad > Funciones de deseabilidad y, a continuación, Optimización y deseabilidad > Establecer deseabilidad. Introduzca la configuración en las ventanas siguientes.
      NOTA: Los pesos importantes son relativos y subjetivos, por lo que vale la pena verificar la sensibilidad del óptimo combinado a los cambios en estos pesos dentro de un rango razonable (por ejemplo, de ponderación igual a ponderación 1:5).
    2. Ordene al generador de perfiles que encuentre la configuración de factores óptima que maximice la función de deseabilidad (Figura 12): en el generador de perfiles, seleccione Optimización y deseabilidad > Maximizar deseabilidad.
      NOTA: Los valores previstos de las respuestas en los candidatos óptimos pueden sobrestimar el valor de las respuestas sesgadas a la derecha, como la potencia; Sin embargo, las ejecuciones de confirmación proporcionarán observaciones más precisas de estas formulaciones candidatas. El objetivo principal es localizar la formulación óptima (la configuración de la receta óptima).
    3. Registre la configuración óptima de factores y anote las ponderaciones importantes utilizadas para cada respuesta: en el menú Prediction Profiler , seleccione Factor Settings > Remember Settings (Recordar configuración).
  15. Opcional: Para factores categóricos como el tipo de lípido ionizable, encuentre las formulaciones condicionalmente óptimas para cada nivel de factor.
    1. Primero establezca el nivel deseado del factor en el generador de perfiles, luego mantenga presionada la tecla Ctrl y haga clic izquierdo dentro del gráfico de ese factor y seleccione Configuración de factores de bloqueo. Seleccione Optimización y deseabilidad > Maximizar deseabilidad para encontrar el óptimo condicional con este factor bloqueado en su configuración actual.
    2. Desbloquee la configuración de factor antes de continuar, utilizando el mismo menú utilizado para bloquear la configuración de factor.
  16. Repita el proceso de optimización después de ajustar los pesos de importancia de las respuestas (usando Optimización y Deseabilidad > Establecer deseabilidades), tal vez solo optimizando la(s) respuesta(s) primaria(s) o configurando algunas de las respuestas secundarias para que tengan más o menos peso de importancia, o estableciendo el objetivo de las respuestas secundarias a Ninguna (Figura 13).
  17. Registre el nuevo candidato óptimo (en el menú Prediction Profiler, seleccione Factor Settings > Remember Settings (Recordar ajustes).
  18. Producir resúmenes gráficos de las regiones óptimas del espacio factorial: generar una tabla de datos con 50.000 filas pobladas con ajustes de factores generados aleatoriamente dentro del espacio factorial permitido, junto con los correspondientes valores predichos del modelo reducido para cada una de las respuestas y la función de deseabilidad conjunta.
    1. En el generador de perfiles, seleccione Tabla aleatoria de salida. Establezca ¿Cuántas ejecuciones desea simular? en 50.000 y haga clic en Aceptar .
      NOTA: Esto genera una nueva tabla con los valores previstos de las respuestas en cada una de las 50.000 formulaciones. La columna Deseabilidad depende de las ponderaciones de importancia de las respuestas que existen cuando se selecciona la opción Tabla aleatoria de salida .
    2. En la tabla recién creada, agregue una nueva columna que calcule el percentil de la columna Deseabilidad. Utilice esta columna de percentiles en los gráficos ternarios en lugar de la columna de deseabilidad sin procesar. Haga clic con el botón secundario en el encabezado de columna Deseabilidad y seleccione Nueva columna de fórmula > Probabilidad distributiva > acumulativa para crear una nueva columna Probabilidad acumulativa.
    3. Genere los gráficos descritos en los pasos siguientes. Modifique repetidamente el esquema de color de los gráficos para mostrar las predicciones para cada respuesta y para la columna Probabilidad acumulativa.
    4. Construir gráficos ternarios para los cuatro factores lipídicos. En la tabla, vaya a Gráfico > Gráfico ternario, seleccione los factores de mezcla para X, Trazado y haga clic en Aceptar. Haga clic con el botón secundario en uno de los gráficos resultantes, seleccione Leyenda de fila y, a continuación, seleccione la columna de respuesta prevista. Cambie el menú desplegable Colores a Jet.
      NOTA: Esto muestra las regiones de mejor y peor rendimiento con respecto a los factores lipídicos. La Figura 14 muestra los percentiles de la conveniencia conjunta al considerar maximizar la potencia (importancia = 1) y minimizar el tamaño (importancia = 0.2), mientras promedia cualquier factor que no se muestre en los ejes de la gráfica ternaria. La figura 15 muestra el tamaño bruto previsto. También es razonable desglosar estos gráficos condicionalmente en otros factores, como la creación de un conjunto distinto de gráficos ternarios para cada tipo de lípidos ionizables con un filtro de datos local (disponible en el menú del triángulo rojo junto a Gráfico ternario).
    5. Del mismo modo, utilice Graph > Graph Builder para trazar los 50.000 puntos codificados por colores (que representan formulaciones únicas) contra los factores de proceso sin mezcla, ya sea individual o conjuntamente, y busque relaciones entre la(s) respuesta(s) y la(s) factor(es). Busque la configuración de factores que produzca la mayor conveniencia. Explora diferentes combinaciones de factores en los gráficos.
      NOTA: Al colorear gráficos, utilice Probabilidad acumulativa[ Deseabilidad], pero al trazar la conveniencia en el eje vertical contra factores de proceso, utilice la columna Deseabilidad sin procesar. La columna Deseabilidad también se puede colocar en un eje de la visualización 3D Graph > Scatterplot junto con otros dos factores de proceso para la exploración multivariante. La Figura 16 muestra la conveniencia conjunta de todas las formulaciones que se pueden formar con cada uno de los tres tipos de lípidos ionizables. Las formulaciones más deseables utilizan H102, con H101 proporcionando algunas alternativas potencialmente competitivas.
    6. Guarde el generador de perfiles y su configuración recordada en la tabla de datos. Haga clic en el triángulo rojo situado junto a Generador de perfiles y seleccione Guardar script > A tabla de datos....

Figure 8
Figura 8: Lecturas de potencia observadas del experimento. Los puntos muestran los valores de potencia que se observaron en las 23 carreras; Las ejecuciones de referencia replicadas se muestran en verde. Haga clic aquí para ver una versión más grande de esta figura.

Figure 9
Figura 9: Cuadro de diálogo de software para iniciar el análisis. Los efectos candidatos se han introducido junto con la respuesta de potencia objetivo, y la opción Sin intercepción se ha desmarcado. Haga clic aquí para ver una versión más grande de esta figura.

Figure 10
Figura 10. Cuadro de diálogo adicional para especificar las opciones de SVEM. Por defecto, los efectos principales de los lípidos se fuerzan en el modelo. Debido a que se incluye una intercepción, recomendamos desmarcar estas casillas para no forzar los efectos. Haga clic aquí para ver una versión más grande de esta figura.

Figure 11
Figura 11: Gráfico real por predicho. Esta figura traza la potencia observada contra el valor predicho para cada formulación por el modelo SVEM. La correlación no necesita ser tan fuerte como lo es en este ejemplo, pero la expectativa es ver al menos una correlación moderada y verificar si hay valores atípicos. Haga clic aquí para ver una versión más grande de esta figura.

Figure 12
Figura 12: Perfilador de predicción. Las dos filas superiores de gráficos muestran los segmentos de la función de respuesta prevista en la formulación óptima (según lo identificado por el enfoque SVEM). La fila inferior de gráficos muestra la "conveniencia" ponderada de la formulación, que es una función de la última columna de gráficos que muestra que la potencia debe maximizarse y el tamaño debe minimizarse. Haga clic aquí para ver una versión más grande de esta figura.

Figure 13
Figura 13: Tres candidatos de formulación óptimos de SVEM-Forward Selection. Cambiar la ponderación de importancia relativa de las respuestas puede conducir a diferentes formulaciones óptimas. Haga clic aquí para ver una versión más grande de esta figura.

Figure 14
Figura 14: Gráficos ternarios para el percentil de deseabilidad. La gráfica muestra las 50.000 formulaciones codificadas por colores por percentil de deseabilidad, donde la conveniencia se establece con un peso de importancia de 1.0 para maximizar la potencia y 0.2 para minimizar el tamaño, estas gráficas muestran que la región óptima de las formulaciones consiste en porcentajes más bajos de lípidos ionizables y porcentajes más altos de PEG. Haga clic aquí para ver una versión más grande de esta figura.

Figure 15
Figura 15: Gráfica ternaria para el tamaño previsto. La gráfica muestra las predicciones de tamaño del modelo SVEM para cada una de las 50.000 formulaciones. El tamaño se minimiza con porcentajes más altos de lípidos auxiliares y se maximiza con porcentajes más bajos de ayudante. Dado que los otros factores varían libremente a través de las 50.000 formulaciones trazadas, esto implica que esta relación se mantiene en todos los rangos de los otros factores (PEG, caudal, etc.). Haga clic aquí para ver una versión más grande de esta figura.

Figure 16
Figura 16: Diagramas de violín para la conveniencia de formulaciones que involucren los tres tipos diferentes de lípidos ionizables. Cada uno de los 50.000 puntos representa una formulación única de todo el espacio de factor permitido. Los picos de estas distribuciones son los valores máximos de deseabilidad que se calculan analíticamente con el perfilador de predicción. H102 tiene el pico más grande y, por lo tanto, produce la formulación óptima. El enfoque SVEM para construir el modelo que genera esta salida filtra automáticamente los factores estadísticamente insignificantes: el propósito de este gráfico es considerar la importancia práctica en todos los niveles de factores. Haga clic aquí para ver una versión más grande de esta figura.

5. Ejecuciones de confirmación

  1. Prepare una tabla que enumere los candidatos óptimos identificados previamente (Figura 17).
    NOTA: Los valores de Potencia verdadera y Tamaño verdadero en la Figura 17 se completan utilizando las funciones generadoras simuladas: en la práctica, se obtendrán formulando y luego midiendo el rendimiento de estas recetas.
    1. Incluya el control de referencia con el conjunto de ejecuciones candidatas que se formularán y medirán.
    2. Si se encontró que alguna de las formulaciones del experimento produce resultados deseables, tal vez superando el punto de referencia, seleccione la mejor para agregar a la tabla de candidatos y vuelva a probar junto con nuevas formulaciones.
      NOTA: Agregue manualmente las ejecuciones deseadas a la tabla candidata o utilice la configuración recordada de la ventana Generador de perfiles si estas ejecuciones son del experimento anterior. Identifique el número de fila de la ejecución, vaya a Configuración de factores de > del generador de perfiles de predicción > Establecer en Datos en fila e introduzca el número de fila. A continuación, elija Prediction Profiler > Factor Settings (Configuración de factores > Remember Settings (Recordar configuración ) y etiquétela adecuadamente (por ejemplo, "benchmark" o "mejor ejecución del experimento anterior").
    3. Haga clic con el botón derecho en la tabla Configuración recordada del generador de perfiles y seleccione Convertir en tabla de datos.
      NOTA: Dependiendo de la prioridad y el presupuesto del estudio, considere la posibilidad de ejecutar réplicas para cada ejecución de confirmación, especialmente si reemplaza el punto de referencia. Cree y analice cada formulación dos veces, utilizando el resultado promedio para la clasificación. Preste atención a cualquier candidato con un amplio rango de respuesta en las dos réplicas, ya que esto podría indicar una alta variación del proceso.
    4. Si es necesario debido a restricciones presupuestarias, seleccione a continuación entre los candidatos identificados para que coincidan con el presupuesto experimental o para eliminar candidatos redundantes.
  2. Llevar a cabo las ejecuciones de confirmación. Construya las formulaciones y reúna las lecturas.
  3. Compruebe la coherencia entre los resultados del experimento original y los resultados del lote de confirmación para puntos de referencia u otras recetas repetidas. Si hay un cambio grande e inesperado, considere qué podría haber contribuido al cambio y si es posible que todas las ejecuciones del lote de confirmación se hayan visto afectadas.
  4. Comparar el rendimiento de las formulaciones óptimas candidatas. Explore si algún candidato nuevo superó el punto de referencia.
  5. Opcional: Agregue el resultado de las ejecuciones de confirmación a la tabla experimental y vuelva a ejecutar el análisis en la Sección 4.
    NOTA: El siguiente paso del flujo de trabajo proporciona instrucciones para construir un estudio de seguimiento junto con estas ejecuciones si se desea.

Figure 17
Figura 17: Tabla de diez candidatos óptimos que se ejecutarán como ejecuciones de confirmación. La potencia verdadera y el tamaño verdadero se han rellenado desde las funciones generadoras de simulación (sin ningún proceso añadido o variación analítica). Haga clic aquí para ver una versión más grande de esta figura.

6. Opcional: Diseñar un estudio de seguimiento que se ejecutará simultáneamente con las ejecuciones de confirmación

  1. Evaluar la necesidad de un estudio de seguimiento teniendo en cuenta los siguientes criterios:
    1. Determine si la formulación óptima se encuentra a lo largo de uno de los límites del factor y si se desea un segundo experimento para expandir al menos uno de los rangos de factores.
    2. Evalúe si el experimento inicial utilizó un tamaño de ejecución relativamente pequeño o rangos de factores relativamente grandes y si es necesario "acercar" la región óptima identificada con ejecuciones adicionales y análisis actualizados.
    3. Compruebe si se está introduciendo un factor adicional. Esto podría ser un nivel de un factor categórico, como un lípido ionizable adicional o un factor que permaneció constante en el estudio inicial, por ejemplo, la concentración de tampón.
    4. Si no se cumple ninguna de las condiciones anteriores, continúe con el paso 7.
  2. Prepárese para que se lleven a cabo ejecuciones experimentales adicionales simultáneamente con las ejecuciones de confirmación.
    1. Definir los límites factoriales asegurando una superposición parcial con la región desde el estudio inicial. Si no existe superposición, se debe diseñar un nuevo estudio.
    2. Desarrollar las nuevas ejecuciones experimentales con un diseño que llene el espacio. Seleccione DOE > Diseño de relleno de espacio > de propósito especial.
      NOTA: Para usuarios avanzados, considere un diseño óptimo D a través de DOE > Custom Design.
    3. Después de generar las ejecuciones de relleno de espacio, incorpore manualmente dos o tres ejecuciones del experimento original que se encuentran dentro del nuevo espacio factorial. Distribuya estas ejecuciones aleatoriamente dentro de la tabla experimental siguiendo los pasos descritos en la Sección 2 para agregar filas y, a continuación, aleatorizar el orden de las filas.
      NOTA: Estos se utilizarán para estimar cualquier cambio en los medios de respuesta entre bloques.
    4. Concatenar las ejecuciones de confirmación y las nuevas ejecuciones de relleno de espacio en una sola tabla y aleatorizar el orden de ejecución. Utilice Tablas > Concatenar y, a continuación, cree y ordene por una nueva columna aleatoria para aleatorizar el orden de ejecución, como se describe en la Sección 2.
  3. Formular las nuevas recetas y recoger los resultados.
  4. Concatenar las nuevas ejecuciones experimentales y los resultados en la tabla de datos del experimento original, introduciendo una columna de ID de experimento para indicar el origen de cada resultado. Utilice Tablas > Concatenar y seleccione la opción Crear columna de origen.
  5. Verifique que las propiedades de columna para cada factor muestren el rango combinado en ambos estudios: haga clic con el botón derecho en el encabezado de columna para cada factor y examine los rangos de propiedades Codificación y Mezcla , si están presentes.
  6. Comience el análisis de los resultados del nuevo experimento.
    1. Incluya la columna de identificador de experimento como un término en el modelo para que sirva como factor de bloqueo. Asegúrese de que este término no interactúe con los factores de estudio. Ejecute el script de diálogo Ajustar modelo guardado en la tabla de la Sección 4, seleccione la columna Id. de experimento y haga clic en Agregar para incluirlo en la lista de efectos candidatos.
    2. Ejecute este cuadro de diálogo Ajustar modelo en la tabla de datos concatenados para analizar conjuntamente los resultados del nuevo experimento y del estudio inicial. Adhiérase a las instrucciones anteriores para generar candidatos de formulación óptimos actualizados y resúmenes gráficos.
    3. Para la validación, analice de forma independiente los resultados del nuevo experimento, excluyendo los resultados del experimento inicial. Es decir, realice los pasos descritos en la Sección 4 de la nueva tabla experimental.
    4. Asegúrese de que las formulaciones óptimas identificadas por estos modelos se alineen estrechamente con las reconocidas por el análisis conjunto.
    5. Revise los resúmenes gráficos para confirmar que tanto los análisis conjuntos como los individuales de los nuevos resultados experimentales exhiben comportamientos similares en la superficie de respuesta (lo que significa que existe una relación similar entre las respuestas y los factores).
    6. Compare los análisis combinados e individuales de los nuevos resultados con el experimento inicial para obtener consistencia. Utilice estructuras gráficas similares para la comparación y examine las recetas óptimas identificadas para las diferencias.

7. Documentar las conclusiones científicas finales del estudio

  1. Si el control de referencia cambia a una receta recién identificada debido al estudio, registre la nueva configuración y especifique los archivos de diseño y análisis que registran su origen.
  2. Mantenga todas las tablas experimentales y resúmenes de análisis, preferiblemente con nombres de archivo con marca de fecha, para referencia futura.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Este enfoque ha sido validado en ambos tipos de lípidos ampliamente clasificados: lípidos clásicos similares a MC3 y lipidoides (por ejemplo, C12-200), generalmente derivados de la química combinatoria. En comparación con una formulación de referencia de LNP desarrollada utilizando un método de un factor a la vez (OFAT), las formulaciones candidatas generadas a través de nuestro flujo de trabajo con frecuencia demuestran mejoras de potencia de 4 a 5 veces en una escala logarítmica, como se muestra en las lecturas de luciferasa hepática de ratón en la Figura 18. La Tabla 1 muestra las mejoras correspondientes en la expresión de luciferasa hepática de ratón observadas sobre el rendimiento del control de referencia a lo largo de dos fases de optimización (un estudio inicial y un estudio de seguimiento posterior). En la primera fase, la atención se centró en optimizar las proporciones de lípidos manteniendo constantes otros factores. En el estudio de seguimiento, se introdujo un tipo de lípido auxiliar adicional y se realizó la optimización teniendo en cuenta tanto la composición de la relación lipídica como el tipo de lípido auxiliar. En consecuencia, se seleccionó el tipo de lípido auxiliar recién introducido para ser utilizado con la composición lipídica optimizada asociada. La mejora significativa en la potencia sugiere que estas composiciones optimizadas pueden exhibir capacidades superiores de escape endosomal25.

Las simulaciones se pueden utilizar para mostrar la calidad esperada del candidato óptimo producido por este procedimiento. En el marco del experimento de ejemplo utilizado en el protocolo, podemos repetir la simulación muchas veces para diferentes tamaños de ejecución y evaluar los resultados de acuerdo con la función de generación de procesos simulada. Se proporciona un script JMP para este propósito en el archivo complementario 4. Específicamente, se generó un diseño de llenado de espacio y las columnas de respuesta se llenaron con valores de nuestras funciones de generador, además de ruido que representa la variación analítica y del proceso. Ajustamos estas respuestas simuladas con diferentes técnicas de análisis (incluida la selección SVEM Forward) para producir una receta óptima candidata correspondiente. Los candidatos de cada método de análisis se comparan con el valor del óptimo verdadero de las funciones generadoras. La Figura 19 ilustra el porcentaje promedio de la respuesta teórica máxima lograda por cada uno de los tres métodos de análisis utilizando diseños de tamaño de relleno de espacio dados en el eje horizontal. El modelo completo, que incluye todos los efectos candidatos y no reduce el modelo basado en la significación estadística de esos efectos, tiene el peor desempeño. Gran parte del trabajo adicional que tradicionalmente se dedica a ajustar modelos de regresión para experimentos de proceso de mezcla implica modificaciones (eliminar la intersección, forzar los efectos principales de la mezcla, excluir el uso de efectos de mezcla cuadrática pura, etc.) que se requieren para ajustar este modelo completo9, y desde esta perspectiva, esos procedimientos son innecesarios12. Además, este modelo no se puede ajustar hasta que el tamaño de diseño alcance el número de efectos en el modelo. En tamaños experimentales más pequeños, podemos ajustar el método tradicional de selección directa, que supera al modelo completo con respecto al rendimiento promedio de la formulación candidata óptima para cada tamaño experimental fijo. Del mismo modo, la modificación de SVEM a este enfoque de selección hacia adelante mejora aún más el rendimiento de los candidatos óptimos. Este gráfico revela que el uso de SVEM-Forward Selection12,13 para analizar un experimento de relleno de espacio de 24 ejecuciones logra la misma calidad promedio que normalmente requiere 50 ejecuciones cuando se analiza con un modelo tradicional de selección directa (apuntando a AICc mínimo). Aunque el rendimiento real variará de un proceso a otro, esta simulación, junto con los resultados publicados en SVEM 12,13,16,17,26, demuestra el potencial de este procedimiento de modelado para la optimización de la formulación.

Figure 18
Figura 18: Mejora en la expresión de luciferasa hepática después de dos rondas de experimentación. La Ronda 0 muestra la lectura de luciferasa hepática para la formulación de referencia; La Ronda 1 muestra la lectura de luciferasa hepática después del primer experimento que optimiza las proporciones molares lipídicas constituyentes de LNP; La Ronda 2 muestra la lectura de luciferasa hepática después del segundo experimento, lo que optimiza aún más las proporciones molares constituyentes al tiempo que considera un tipo de lípido auxiliar adicional. Haga clic aquí para ver una versión más grande de esta figura.

Figure 19
Figura 19: Calidad de la formulación óptima en función del tamaño experimental y del modelo estadístico. El eje vertical representa el porcentaje de máxima conveniencia teórica, y el eje horizontal representa el tamaño del diseño de relleno de espacio. Cada punto muestra la media de más de 150 simulaciones. La línea azul (triángulos) representa el modelo completo (sin ninguna eliminación de efectos estadísticamente insignificantes), la línea ámbar (círculos) representa el modelo tradicional de selección hacia adelante basado en AICc (con una intersección y sin forzar los efectos principales de la mezcla), y la línea verde (triángulos al revés) representa el modelo de selección hacia adelante basado en SVEM (con una intersección y sin forzar los efectos principales de la mezcla). Haga clic aquí para ver una versión más grande de esta figura.

Redondo ID de partícula Expresión de luciferasa en el hígado (fotón/seg)
0 Punto de referencia de control 8.E+06
1 Optimizado sobre proporciones de lípidos 2.E+09
2 Optimizado sobre proporciones de lípidos y tipo de lípido auxiliar 8.E+10

Tabla 1: Mejora sistemática en la expresión de luciferasa a través de la optimización del Diseño del Experimento (DOE). Esta tabla ilustra la mejora significativa en la expresión de la luciferasa, con una mejora de hasta 10.000 veces en la escala de fotones / segundo, desde el punto de referencia inicial hasta el "candidato óptimo" final.

Archivo complementario 1: 04APR2023 Resumen.docx - Este documento proporciona un registro del estudio que incluye su propósito, las respuestas evaluadas, los factores considerados y el número total de ejecuciones ejecutadas. Haga clic aquí para descargar este archivo.

Archivo complementario 2: 23_run_simulated_experiment.jmp - Un archivo JMP con el experimento simulado y sus resultados. Este archivo también incluye scripts de análisis adjuntos compatibles con JMP 17 Pro. Haga clic aquí para descargar este archivo.

Archivo complementario 3: 23_run_simulated_experiment.xlsx - Un archivo de Excel que incluye el experimento simulado y sus resultados, adecuado para lectores que pueden no tener acceso a JMP. Haga clic aquí para descargar este archivo.

Archivo complementario 4: simulación de mezcla 20DEC22.jsl - Este es un script JMP 17 Pro utilizado para simular experimentos de formulación de LNP y evaluar el rendimiento de diferentes métodos de análisis. El script utiliza el enfoque SVEM-Forward Selection (sin intercepción), que es el método de análisis clave utilizado en este flujo de trabajo. Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

El software moderno para el diseño y análisis de experimentos de procesos de mezcla hace posible que los científicos mejoren sus formulaciones de nanopartículas lipídicas en un flujo de trabajo estructurado que evita la experimentación OFAT ineficiente. El enfoque de modelado SVEM recientemente desarrollado elimina muchas de las modificaciones de regresión arcanas y las estrategias de reducción del modelo que pueden haber distraído previamente a los científicos con consideraciones estadísticas extrañas. Una vez que se recopilan los resultados, el marco de análisis SVEM ofrece un enfoque que es más fácil de implementar y tiende a producir mejores modelos que los enfoques de modelado tradicionales13. Además, los análisis gráficos que se basan en las fórmulas de predicción para cada respuesta son fácilmente interpretables por los científicos, dando un resumen claro del comportamiento marginal de la respuesta sobre factores individuales, así como pequeños grupos de factores sin requerir la interpretación de estimaciones de parámetros altamente correlacionados de un modelo de regresión. Esto permite a los científicos centrarse en evaluar la importancia práctica a través de los factores del estudio después de que SVEM haya eliminado automáticamente los efectos estadísticamente insignificantes.

El flujo de trabajo se ha utilizado en la práctica para variar sistemáticamente la composición de lípidos y los parámetros de formulación, como la relación N / P, el caudal y la relación de mezcla para la optimización y para seleccionar los mejores tipos de lípidos auxiliares, tipos de lípidos ionizables y tipos de tampón. Los objetivos de estos ejemplos generalmente incluyen maximizar la potencia in vivo o in vitro y encapsular cargas útiles variables como ARNm o ADN para objetivos relevantes in vivo, como células hepáticas, o a veces en múltiples tipos de células en el caso de aplicaciones in vitro. Para aplicaciones específicas, es posible que necesitemos equilibrar las propiedades biofísicas como el tamaño, PDI, el potencial zeta y el porcentaje de encapsulación mientras examinamos la potencia in vivo. Además, el objetivo es encontrar una formulación potente, pero bien tolerada, por lo que podemos incluir respuestas como el cambio en el peso corporal, la respuesta de citoquinas o la obtención de enzimas hepáticas como AST / ALT en el análisis. Los patrones han surgido de numerosos experimentos de LNP. En particular, las alteraciones en la relación molar del lípido ionizable y la relación N / P parecen afectar significativamente la encapsulación del ARN. Además, los cambios en la relación molar PEG parecen afectar la estabilidad de las partículas, como lo indican las influencias sobre el tamaño y la PDI. En general, un exceso de PEG en el núcleo de LNP tiende a tener un efecto perjudicial sobre la potencia en ratones.

Las mejoras en el rendimiento son especialmente notables cuando se dirige a más de una respuesta: incluso si el punto de referencia ya funciona bien con respecto a la respuesta primaria (por ejemplo, potencia), la optimización conjunta generalmente mantiene o mejora el comportamiento con respecto a la respuesta primaria y, al mismo tiempo, mejora el comportamiento con respecto a otras respuestas (minimizando PDI, tamaño o pérdida de peso corporal). Validamos la autenticidad de estas mejoras con ejecuciones de confirmación, en las que preparamos y comparamos directamente la formulación de referencia (posiblemente con una réplica) y las nuevas formulaciones candidatas.

La fase de diseño de este flujo de trabajo tiene varios pasos críticos. Primero, asegúrese de que los factores y sus rangos se ingresen correctamente en la plataforma de diseño que llena el espacio. En segundo lugar, utilice gráficos y conocimiento de la materia para confirmar la viabilidad de cada formulación resultante antes de iniciar el experimento. Finalmente, ejecute el experimento siguiendo el orden aleatorio especificado por la tabla de diseño. Adherirse a esta secuencia ayuda a evitar que las covariables no medidas, como el orden de producción de la formulación o la temperatura ambiente, confundan los factores en estudio. Los diseños que llenan el espacio son más fáciles de construir, con menos potencial de error para el usuario que los diseños óptimos de procesos de mezcla, que requieren decisiones adicionales durante la configuración que pueden frustrar a los usuarios inexpertos y desalentarlos de usar experimentos diseñados. Sin embargo, después de trabajar a través de este protocolo, los científicos pueden beneficiarse de una lectura adicional sobre cómo los diseños óptimos podrían reemplazar los diseños de relleno de espacio en el protocolo, como se describe en el Capítulo 6 de Goos y Jones (2011) 27. Especialmente para los estudios de seguimiento que "se acercan" a una región óptima, donde hay menos preocupación por las fallas a lo largo de los límites de la mezcla, los diseños D-óptimos pueden ser más eficientes que los diseños que llenan el espacio.

Del mismo modo, la fase de análisis de este flujo de trabajo tiene varios pasos críticos. Primero, asegúrese de que el modelo especifique un conjunto apropiado de efectos candidatos, incluidas las interacciones, en lugar de solo los efectos principales (de primer orden) de los factores. En segundo lugar, emplee SVEM Forward Selection como marco de modelado. En tercer lugar, deshabilite la opción predeterminada No Intercept y evite forzar los efectos principales de la mezcla. Finalmente, configure correctamente las funciones de conveniencia para las respuestas antes de iniciar la optimización. Para los usuarios sin acceso a SVEM, el mejor enfoque es utilizar la selección directa tradicional (apuntando a AICc mínimo) para el problema de regresión12. El protocolo menciona que también es posible usar SVEM Lasso: en promedio, este enfoque da resultados similares a SVEM Forward Selection, aunque para conjuntos de datos particulares los dos enfoques pueden producir formulaciones óptimas ligeramente diferentes que podrían compararse con las ejecuciones de confirmación12. Sin embargo, SVEM Lasso dará resultados de modelado inferiores si el usuario comete el error fácil de olvidar deshabilitar la opción predeterminada Sin intercepción 12: por esta razón, hemos utilizado SVEM Forward Selection como método predeterminado, ya que es más robusto a esta opción.

La principal limitación de este método es que habrá estudios ocasionales con mayor complejidad que se beneficiarán de la ayuda de un estadístico para el diseño y análisis. Situaciones en las que el presupuesto de ejecución es más limitado de lo habitual (por debajo de la heurística mínima), las respuestas son binarias, hay un gran número de factores categóricos o niveles de un solo factor categórico, donde un objetivo de investigación es considerar la eliminación de uno o más factores de mezcla de la receta, o donde hay restricciones adicionales en el espacio de factores pueden ser abordados de manera diferente por un estadístico, por ejemplo, utilizando diseños óptimos o híbridos12,28 o agregando estructura adicional al diseño. Específicamente, se podría formar un diseño híbrido creando un diseño que llene el espacio con la mayoría de las ejecuciones presupuestadas y luego "aumentando" el diseño con las ejecuciones restantes (generalmente 2-4) utilizando un criterio óptimo D. Otro enfoque híbrido es generar un diseño de relleno de espacio sobre los factores de mezcla (lípido) y continuo (proceso), y luego agregar cualquier factor categórico utilizando una asignación "óptima" de niveles de factores. Sin embargo, el enfoque simplificado de diseño de llenado de espacio adoptado en el protocolo se ha desarrollado en los últimos años en el proceso de ejecución de docenas de experimentos de optimización de formulación de LNP, y creemos que ofrece un enfoque robusto que funcionará con éxito en la mayoría de los casos al tiempo que brinda a los científicos confianza en su capacidad para utilizar experimentos diseñados.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

La estrategia de diseño experimental que sustenta este flujo de trabajo se ha empleado en dos solicitudes de patente en las que uno de los autores es inventor. Además, Adsurgo, LLC es un socio certificado de JMP. Sin embargo, el desarrollo y la publicación de este documento se llevaron a cabo sin ningún tipo de incentivo financiero, estímulo u otros incentivos por parte de JMP.

Acknowledgments

Agradecemos al editor y a los árbitros anónimos por las sugerencias que mejoraron el artículo.

Materials

Name Company Catalog Number Comments
JMP Pro 17.1 JMP Statistical Discovery LLC

DOWNLOAD MATERIALS LIST

References

  1. Dolgin, E. Better lipids to power next generation of mRNA vaccines. Science. 376 (6594), 680-681 (2022).
  2. Hou, X., Zaks, T., Langer, R., Dong, Y. Lipid nanoparticles for mRNA delivery. Nature Reviews Materials. 6 (12), 1078-1094 (2021).
  3. Huang, X., et al. The landscape of mRNA nanomedicine. Nature Medicine. 28, 2273-2287 (2022).
  4. Rampado, R., Peer, D. Design of experiments in the optimization of nanoparticle-based drug delivery systems. Journal of Controlled Release. 358, 398-419 (2023).
  5. Kauffman, K. J., et al. Optimization of lipid nanoparticle formulations for mRNA delivery in vivo with fractional factorial and definitive screening designs. Nano Letters. 15, 7300-7306 (2015).
  6. Jones, B., Nachtsheim, C. J. A class of three-level designs for definitive screening in the presence of second-order effects. Journal of Quality Technology. 43, 1-15 (2011).
  7. Cornell, J. Experiments with Mixtures: Designs, Models, and the Analysis of Mixture Data. Wiley Series in Probability and Statistics. , Wiley. (2002).
  8. Jones, B. Proper and improper use of definitive screening designs (DSDs). JMP user Community. , https://community.jmp.com/t5/JMP-Blog/Proper-and-improper-use-of-Definitive-Screening-Designs-DSDs/bc-p/546773 (2016).
  9. Myers, R., Montgomery, D., Anderson-Cook, C. Response Surface Methodology. , Wiley. (2016).
  10. Lekivetz, R., Jones, B. Fast flexible space-filling designs for nonrectangular regions. Quality and Reliability Engineering International. 31, 829-837 (2015).
  11. Czitrom, V. One-factor-at-a-time versus designed experiments. The American Statistician. 53, 126-131 (1999).
  12. Karl, A., Wisnowski, J., Rushing, H. JMP Pro 17 remedies for practical struggles with mixture experiments. JMP Discovery Conference. , (2022).
  13. Lemkus, T., Gotwalt, C., Ramsey, P., Weese, M. L. Self-validated ensemble models for design of experiments. Chemometrics and Intelligent Laboratory Systems. 219, 104439 (2021).
  14. Gotwalt, C., Ramsey, P. Model validation strategies for designed experiments using bootstrapping techniques with applications to biopharmaceuticals. JMP Discovery Conference. , (2018).
  15. Xu, L., Gotwalt, C., Hong, Y., King, C. B., Meeker, W. Q. Applications of the fractional-random-weight bootstrap. The American Statistician. 74 (4), 345-358 (2020).
  16. Ramsey, P., Levin, W., Lemkus, T., Gotwalt, C. SVEM: A paradigm shift in design and analysis of experiments. JMP Discovery Conference Europe. , (2021).
  17. Ramsey, P., Gaudard, M., Levin, W. Accelerating innovation with space filling mixture designs, neural networks and SVEM. JMP Discovery Conference. , (2021).
  18. Lemkus, T. Self-Validated Ensemble modelling. Doctoral Dissertations. 2707. , https://scholars.unh.edu/dissertation/2707 (2022).
  19. Juran, J. M. Juran on Quality by Design: The New Steps for Planning Quality into Goods and Services. , Free Press. (1992).
  20. Yu, L. X., et al. Understanding pharmaceutical quality by design. The AAPS Journal. 16, 771 (2014).
  21. Simpson, J. R., Listak, C. M., Hutto, G. T. Guidelines for planning and evidence for assessing a well-designed experiment. Quality Engineering. 25, 333-355 (2013).
  22. Daniel, S., Kis, Z., Kontoravdi, C., Shah, N. Quality by design for enabling RNA platform production processes. Trends in Biotechnology. 40 (10), 1213-1228 (2022).
  23. Scheffé, H. Experiments with mixtures. Journal of the Royal Statistical Society Series B. 20, 344-360 (1958).
  24. Brown, L., Donev, A. N., Bissett, A. C. General blending models for data from mixture experiments. Technometrics. 57, 449-456 (2015).
  25. Herrera, M., Kim, J., Eygeris, Y., Jozic, A., Sahay, G. Illuminating endosomal escape of polymorphic lipid nanoparticles that boost mRNA delivery. Biomaterials Science. 9 (12), 4289-4300 (2021).
  26. Lemkus, T., Ramsey, P., Gotwalt, C., Weese, M. Self-validated ensemble models for design of experiments. ArXiv. , 2103.09303 (2021).
  27. Goos, P., Jones, B. Optimal Design of Experiments: A Case Study Approach. , John Wiley & Sons, Ltd. (2011).
  28. Rushing, H. DOE Gumbo: How hybrid and augmenting designs can lead to more effective design choices. JMP Discovery Conference. , (2020).

Tags

Este mes en JoVE Número 198
Un flujo de trabajo para la optimización de la formulación de nanopartículas lipídicas (LNP) utilizando experimentos de proceso de mezcla diseñados y modelos de conjunto autovalidados (SVEM)
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Karl, A. T., Essex, S., Wisnowski,More

Karl, A. T., Essex, S., Wisnowski, J., Rushing, H. A Workflow for Lipid Nanoparticle (LNP) Formulation Optimization using Designed Mixture-Process Experiments and Self-Validated Ensemble Models (SVEM). J. Vis. Exp. (198), e65200, doi:10.3791/65200 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter