Medición en línea de concentración de O-cresol basada en espectroscopia infrarroja cercana a través de la regresión parcial de mínimos cuadrados

Engineering

Your institution must subscribe to JoVE's Engineering section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

El protocolo describe un método para predecir la concentración de o-cresol durante la producción de éter de polifenileno utilizando espectroscopia de infrarrojo cercano y regresión parcial de mínimos cuadrados. Para describir el proceso de forma más clara y completa, se utiliza un ejemplo de predicción de la concentración de o-cresol durante la producción de polifenileno para aclarar los pasos.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Chen, Z., Zheng, N., Luan, X., Liu, F. O-cresol Concentration Online Measurement Based On Near Infrared Spectroscopy Via Partial Least Square Regression. J. Vis. Exp. (153), e59077, doi:10.3791/59077 (2019).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

A diferencia de las variables de proceso macroscópicos, la espectroscopia infrarroja cercana proporciona información del proceso a nivel molecular y puede mejorar significativamente la predicción de los componentes en los procesos industriales. La capacidad de registrar espectros para muestras sólidas y líquidas sin ningún pretratamiento es ventajosa y el método es ampliamente utilizado. Sin embargo, las desventajas de analizar datos espectrales de infrarrojo cercano de alta dimensión incluyen la redundancia de la información y la multicolinealidad de los datos espectrales. Por lo tanto, proponemos utilizar el método de regresión de mínimos cuadrados parciales, que tradicionalmente se ha utilizado para reducir la dimensionalidad de los datos y eliminar la colinealidad entre las entidades originales. Implementamos el método para predecir la concentración de o-cresol durante la producción de éter de polifenileno. El enfoque propuesto ofrece las siguientes ventajas sobre los métodos de predicción de regresión de componentes: 1) la regresión parcial de mínimos cuadrados resuelve el problema de la multicolinealidad de las variables independientes y evita eficazmente el sobreajuste, que se produce en un ajuste excesivo, que se produce en un análisis de regresión debido a la alta correlación entre las variables independientes; 2) el uso de los espectros infrarrojos cercanos da como resultado una alta precisión porque es un método no destructivo y no contaminante para obtener información a escalas microscópicas y moleculares.

Introduction

La espectroscopia de infrarrojo cercano (NIR) (NIRS) ha obtenido una amplia aceptación como una tecnología analítica moderna rápida, eficiente, no destructiva y no contaminante; el método se ha utilizado durante los últimos años para la detección y análisis de la calidad del producto y la medición de componentes químicos en procesos industriales. La especialidad más esencial del método es su capacidad para registrar espectros para muestras sólidas y líquidas sin ningún preprocesamiento, haciendo que NIRS sea especialmente adecuado para la detección y análisis directo y rápido de productos naturales y sintéticos1,2. A diferencia de los sensores tradicionales que miden las variables de proceso (por ejemplo, temperatura, presión, nivel de líquido, etc.) a escala macroscópica e inevitablemente sufren el ruido externo y la interferencia de fondo, NIRS detecta la información estructural de la composición química a escalamicroscópica y molecular. Por lo tanto, la información esencial se puede medir con mayor precisión y eficacia que con otros métodos3,4.

El éter de polifenilo, como uno de los plásticos de ingeniería, se utilizan ampliamente debido a su resistencia al calor, retardante de llama, aislamiento, propiedades eléctricas, estabilidad dimensional, resistencia al impacto, resistencia a la fluencia, resistencia mecánica y otras propiedades5. Más importante aún, no es tóxico e inofensivo en comparación con otros plásticos de ingeniería. En la actualidad, 2,6-xilenol es una de las materias primas básicas para la síntesis de éter de polifenileno, y por lo general se prepara mediante alquilación catalizada de fenol con método de metanol6. Hay dos productos principales de este método de preparación, o-cresol y 2,6-xylenol. Después de una serie de pasos de separación y extracción, 2,6 xilenol se utiliza para producir éter de polifenileno. Sin embargo, las cantidades traza de o-cresol permanecen en 2,6-xylenol. O-cresol no participa en la síntesis de éter de polifenileno y permanecerá en el producto de éter de polifenileno, lo que resulta en una disminución en la calidad del producto o incluso el subestándar. En la actualidad, la mayoría de las empresas todavía analizan las composiciones de mezclas orgánicas complejas, como los productos de éter de polifenilo de fase líquida que contienen impurezas (por ejemplo, o-cresol) mediante análisis de separación física o química como la cromatografía7,8. El principio de separación de la cromatografía es el uso de la mezcla de composiciones en la fase fija y la fase de flujo en la disolución, análisis, adsorción, desorción u otra afinidad de las pequeñas diferencias en la interpretación. Cuando las dos fases se mueven en relación entre sí, las composiciones están separadas por las acciones anteriores repetidamente en las dos fases. Dependiendo del objeto, normalmente se tarda unos minutos a unas pocas decenas de minutos en completar una operación compleja de separación de materiales. Se puede ver que la eficiencia de medición es baja.

Hoy en día, la medición de la calidad del producto y la avanzada tecnología de control basada en este análisis para la industria moderna de materiales químicos de proceso fino es la dirección clave para mejorar aún más la calidad del producto. En la industria de procesos de producción de éter de polifenilo, la medición en tiempo real del contenido de o-cresol en el producto de éter de polifenileno es de gran importancia para el desarrollo. El análisis cromatográfico claramente no puede cumplir con los requisitos de la tecnología de control avanzada para la medición en tiempo real de sustancias y la retroalimentación de la señal. Por lo tanto, proponemos el método de regresión parcial de mínimos cuadrados (PLSR) para establecer un modelo lineal entre los datos NIRS y la concentración de o-cresol, que realiza la medición en línea del contenido de o-cresol en el producto de éter de polifenileno líquido de salida .

El preprocesamiento para NIRS desempeña el papel más importante antes del modelado estadístico multivariante. Los números de onda NIRS en el espectro NIR y los tamaños de partículas de muestras biológicas son comparables, por lo que es conocido por efectos de dispersión inesperados que influyen en los espectros de muestras registrados. Al realizar métodos de preprocesamiento adecuados, estos efectos son fáciles de eliminar en gran medida9. Las técnicas de preprocesamiento más utilizadas en NIRS se clasifican como métodos de corrección de dispersión y derivados espectrales. El primer grupo de métodos incluye corrección de dispersión multiplicativa, detrending, transformaciones de variación normales estándar y normalización. Los métodos de derivación espectral incluyen el uso de la primera y la segunda derivada.

Antes de desarrollar un modelo de regresión cuantitativa, es importante eliminar las variaciones de dispersión no sistemáticas de los datos NIRS porque tienen una influencia significativa en la precisión del modelo predictivo, su complejidad y parsimonia. La selección de un método de preprocesamiento adecuado siempre debe depender del paso de modelado posterior. Aquí, si el conjunto de datos espectral NIR no sigue la ley Lambert-Beer, otros factores tienden a compensar el comportamiento no ideal de la predicción de los componentes predichos. La desventaja de la existencia de tales factores innecesarios conduce al aumento de la complejidad del modelo, incluso lo más probable, una reducción de la robustez. Por lo tanto, la aplicación de derivados espectrales y una normalización convencional a los datos espectrales es una parte esencial del método.

Después del preprocesamiento espectral, se obtienen los datos NIRS con una alta relación señal-ruido y baja interferencia de fondo. El análisis NIRS moderno proporciona la rápida adquisición de grandes cantidades de absorbancia en un rango espectral adecuado. La composición química de la muestra se predice entonces extrayendo las variables relevantes utilizando la información contenida en la curva espectral. En general, NIRS se combina con técnicas de análisis multivariante para análisis cualitativos o cuantitativos10. Un análisis de regresión lineal multivariante (MLR) se utiliza comúnmente para desarrollar y extraer la relación matemática entre los datos y los componentes en los procesos industriales y se ha utilizado ampliamente en el análisis NIRS.

Sin embargo, hay dos problemas fundamentales al implementar un MLR para los datos NIRS preprocesados. Un problema es la redundancia variable. La alta dimensionalidad de los datos NIRS a menudo hace que la predicción de una variable dependiente no sea confiable porque se incluyen variables que no tienen correlación con los componentes. Estas variables redundantes reducen la eficiencia de la información de los datos espectrales y afectan a la precisión del modelo. Para eliminar la redundancia variable, es esencial desarrollar y maximizar la correlación entre los datos NIRS y los componentes predichos.

Otro problema es el problema de la multicolinealidad en los datos NIRS. Una de las suposiciones importantes de varios modelos de regresión lineal es que no hay ninguna relación lineal entre ninguna de las variables explicativas del modelo de regresión. Si existe esta relación lineal, se ha demostrado que hay multicolinealidad en el modelo de regresión lineal y se infringe la suposición. En varias regresiones lineales, como una regresión de mínimos cuadrados (OLSR) normal, las correlaciones múltiples entre las variables afectan a la estimación del parámetro, aumentan el error del modelo y afectan a la estabilidad del modelo. Para eliminar la correlación multilineal entre los datos espectrales NIR, utilizamos métodos de selección variable que maximizan la variabilidad inherente de las muestras.

Aquí, proponemos utilizar el PLSR, que es una generalización de la regresión lineal múltiple que ha sido ampliamente utilizado en el campo de NIRS11,12. El PLSR integra las funciones básicas del MLR, el análisis de correlación canónica (CCA) y el análisis de componentes principales (PCA) y combina el análisis de previsión con un análisis de connotación de datos no modelo. El PLSR se puede dividir en dos partes. La primera parte selecciona los componentes de las variables de característica y los componentes predichos mediante el análisis parcial de mínimos cuadrados (PLS). PLS maximiza la variabilidad inherente de los componentes principales haciendo que la covarianza de los componentes principales y los componentes predichos sea lo más grande posible al extraer los componentes principales. A continuación, se establece el modelo OLSR de concentración de o-cresol para los componentes principales seleccionados. PLSR es adecuado para el análisis de datos ruidosos con numerosas variables independientes que son fuertemente colineales y altamente correlacionadas y para el modelado simultáneo de varias variables de respuesta. Además, PLSR extrae la información efectiva de los espectros de muestra, supera el problema de la multicolinealidad, y tiene las ventajas de una fuerte estabilidad y alta precisión de predicción13,14.

El siguiente protocolo describe el proceso de utilización del modelo PLSR para medir la concentración de o-cresol utilizando datos espectrales NIR. La fiabilidad y precisión del modelo se evalúan cuantitativamente utilizando el coeficiente de determinación (Equation 1), el coeficiente de correlación de predicción (Equation 2) y el error de predicción cuadrada media de la validación cruzada (MSPECV). Además, para mostrar intuitivamente las ventajas del PLSR, los indicadores de evaluación se visualizan en varias gráficas para un análisis cualitativo. Por último, los indicadores de evaluación de un experimento se presentan en formato de tabla para ilustrar cuantitativamente la fiabilidad y precisión del modelo PLSR.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Adquisición de datos de espectro NIR con espectrómetro de proceso de transformación Fourier (FT)-NIR

  1. Instale la sonda de fibra óptica de fase líquida del espectrómetro de infrarrojo cercano en la salida del producto de éter de polifenilo. Y abra el software OPUS en el ordenador superior conectado al instrumento y comience a configurar la medición.
  2. Conexión al espectrómetro
    1. En el menú Medir, seleccione el comando Configuración óptica y servicio o haga clic en el icono de la barra de herramientas.
    2. En el cuadro de diálogo que se abre, haga clic en la ficha Banco óptico .
    3. Compruebe si la configuración del espectrómetro está bien. En caso afirmativo, cierre el cuadro de diálogo. Si no, continúe con el paso 4.
    4. En la lista desplegable Configuración, seleccione el tipo de espectrómetro determinado.
    5. Introduzca la dirección IP del espectrómetro en el campo de entrada de URL del banco óptico.
    6. Haga clic en el botón Conectar.
  3. Configuración de parámetros de medición
    1. En el menú Medir, seleccione el comando Medición o haga clic en el icono de la barra de herramientas.
    2. En el cuadro de diálogo que se abre, defina los parámetros de medición en las diferentes fichas.
      NOTA: Los detalles sobre los parámetros de medición individuales se describen en el Manual de referencia de OPUS.
    3. Haga clic en el botón Aceptar y salir.
  4. Almacenamiento del archivo de experimento
    1. En el menú Medir, seleccione el comando Medición avanzada. A continuación, haga clic en la ficha Avanzadas.
    2. En el cuadro de diálogo que se abre, defina la resolución como 4 cm-1.
    3. Defina el número de escaneos como 16 escaneos en los campos de entrada Tiempo de análisis de muestra/fondo.
    4. Defina la ruta para almacenar automáticamente los datos de medición de 4.000 cm-1-12.500 cm-1.
    5. Determine el tipo de datos para el espectro de resultados como Absorbancia.
    6. Haga clic en el botón Guardar.
    7. En el cuadro de diálogo que se abre, defina un nombre para el archivo de experimento y guarde este nombre.
  5. Medición del espectro de fondo
    1. En el menú Medir, seleccione el comando Medición avanzada.
    2. Haga clic en la pestaña Optic.
    3. En el cuadro de diálogo que se abre, haga clic en la lista desplegable Configuración de apertura y seleccione el mismo valor utilizado para adquirir un espectro de muestra.
    4. Haga clic en la pestaña Básico.
    5. En el cuadro de diálogo que se abre, haga clic en el botón Canal único en segundo plano.
  6. Medición del espectro de muestras
    1. Coloque la muestra en la trayectoria óptica del espectrómetro. La forma en que se hace esto depende de la configuración del espectrómetro.
    2. En el menú Medir, seleccione el comando Medición avanzada.
    3. Haga clic en la pestaña Básico.
    4. En el cuadro de diálogo que se abre, defina la descripción de la muestra y el formulario de muestra en el campo de entrada determinado. Esta información se almacena junto con el espectro.
    5. Haga clic en el botón Sample Single Channel (Ejemplo de canal único) para iniciar la medición en línea. Y guarde el espectro NIR de cada escaneo como archivo OPUS.
  7. Recoger las muestras de polifenileno cada 6 h y probar la concentración de o-cresol con cromatografía líquida en el laboratorio de la industria para obtener un valor de referencia químico.
    NOTA: El personal de laboratorio del campo de la industria toma cada muestra de éter de polifenilo de la salida del éter de polifenilo de fase líquida. El contenido de o-cresol en cada muestra se midió tres veces por cromatografía líquida. A continuación, se tomó el valor medio de los resultados del análisis de tres veces como el valor de referencia del contenido de o-cresol para reducir el error accidental.
  8. Obtener 600 valores de referencia química de concentración de o-cresol en el laboratorio. El rango de calibración de la concentración de o-cresol es de 42.1063 mg/1 g de producto de éter de polifenilo a 51.6763 mg/1 g de producto de éter de polifenilo.
  9. Combine los espectros NIR en los tiempos de prueba dados con los valores de referencia químicos de la concentración de o-cresol.
  10. Utilice el software OPUS para leer el conjunto espectral original como se muestra en la Figura 1.
    1. En el menú Archivo, haga clic en el comando Cargar archivo.
    2. En el cuadro de diálogo que se abre, seleccione el archivo de espectro en particular.
    3. Haga clic en el botón Abrir. El espectro se muestra en la ventana de espectro.

2. Preprocesamiento de datos de espectroscopia NIR

  1. Con la función de preprocesamiento espectral en, obtenga dataset espectral preprocesado con derivado de primer orden.
    1. Abra El descodificador, que es un software de análisis de datos multivariante y diseño experimental, seleccione el comando Importar en Archivo. Importe el archivo OPUS como dataset espectral NIR original.
    2. Seleccione el comando Transformar en Modificar. Y seleccione los derivados de Golay Savitzky en Derivados.
    3. Defina las muestras y variables como todas las muestras y todas las variables en el ámbito. Y defina el número de puntos de suavizado como 13 y el derivado como 1st derivado en parámetros.
    4. Haga clic en Aceptar para iniciar la derivada.
      ADVERTENCIA: El aumento de la suavidad puede reducir las fluctuaciones bruscas de la curva, reducir el efecto de ruido, pero también debilitar las características de la curva y hacer que la curva se distorsione. Por lo tanto, la suavidad adecuada seleccionada de acuerdo con la observación de la intensidad de fluctuación real de la curva y el efecto después del procesamiento.
  2. Realice la normalización vectorial en los espectros de muestra para normalizar el valor de la absorbancia.
    1. Seleccione el comando Normalización en Modificar.
    2. Defina las muestras y variables como Todas las muestras y Todas las variables en el ámbito.
    3. Seleccione Normalización vectorial en el Tipo.
    4. Haga clic en Aceptar para realizar la normalización vectorial.

3. Establecimiento del modelo PLSR

  1. Creación del conjunto de datos espectrales NIR
    1. Abra Uncrambler. exe, seleccione Exportar en Archivo con los archivos Matlab para exportar el conjunto de datos espectrales preprocesados a Archivo .mat y obtener el conjunto de datos espectral X automáticamente con 2203 variables.
    2. Obtenga un dataset espectral NIR completo X (una matriz de 600 filas y 2203 columnas) y los valores de referencia química S (un vector de 600 filas) en forma de archivo .mat para su posterior análisis y modelado.
  2. Selección del número adecuado de componentes principales
    1. Abra Matlab e importe el archivo .mat que contiene los datos espectrales preprocesados de infrarrojo cercano al espacio de trabajo arrastrando el archivo .mat al espacio de trabajo.
      NOTA: El archivo .mat almacena los datos espectrales x de infrarrojo cercano como una variable independiente y el contenido de o-cresol del producto como una variable dependiente en forma de dos matrices.
    2. Abra el archivo .m programado en el Editor. Haga clic en Abrir en la opción Editor, seleccione el archivo .m compilado en el directorio de almacenamiento de archivos y, a continuación, haga clic en Confirmar.
    3. Extraer 15 componentes principales según el objetivo de optimización de la Ecuación 1 y el modelo OLSR entre los componentes principales extraídos y los valores previstos de la concentración de o-cresol con el programa que contiene el comando plsregress() en Matlab.
      [XL, YL, XS, YS, BETA, PCTVAR, MSE] á plsregress(X,Y,ncomp,'CV',k);
      Consulte el documento de ayuda de MATLAB para obtener los detalles de uso y el valor devuelto.
      NOTA: Equation 3 Ecuación 1Equation 4
      Equation 5, Equation 6 y es el ide los componentes principales de los datos espectrales NIR;
      Equation 7es la proyección de los componentesprincipales de los datos espectrales NIR;
      Equation 8es el coeficiente de correlación de Pearson para los componentesprincipales y la concentración de o-cresol.
    4. Obtenga Equation 1 el valor de los datos espectrales NIR y los valores previstos para los diferentes componentes principales utilizando La Ecuación 2.
      NOTA: Equation 9 Ecuación 2
      Equation 10es la suma de los cuadrados debido Equation 11 a un error y se define como ;
      Equation 12es la suma total de cuadrados Equation 13 y se define como ;
      Equation 14es el valor de referencia de la concentración de o-cresol del conjunto de datos de prueba;
      Equation 15es el valor previsto de la concentración de o-cresol del conjunto de datos de prueba;
      Equation 16es el valor medio del valor de referencia de la concentración de o-cresol del dataset de ensayo;
      Equation 17es el número de muestras del conjunto de datos de prueba.
    5. Determine Equation 1 los valores y la tendencia con un número creciente de componentes principales como se muestra en la Figura 2. Seleccione 10 como el número adecuado Equation 1 de componentes principales con el valor de 0.9917.
      NOTA:Equation 18 valor es la proporción de la varianza en la variable dependiente que es predecible por las variables independientes. Cuanto mayor Equation 1 sea el valor, mayor será la bondad de ajuste y viceversa.
  3. Validación de la bondad de ajuste y precisión del modelo PLSR con 10 componentes principales mediante el comando plsregress().
    1. Repita el proceso de modelado con 10 componentes principales como pasos 3.2.1-3.2.5 con 10 componentes principales.
    2. Evalúe el modelo basándose en una validación cruzada de 10 veces utilizando las gráficas de la varianza porcentual explicada en los datos espectrales NIR, los residuos y el MSPECV.
    3. Trazar la varianza porcentual explicada en los datos espectrales NIR, los residuos y el MSPECV como figuras 3, 4 y 5.
    4. Tabular los indicadores Equation 1 deEquation 2evaluación de , , y MSPE de validación cruzada de 10 veces para el modelo PLSR para un análisis cuantitativo como se muestra en el Cuadro 1.
      NOTA: Las ecuaciones de Equation 2 y MSPE se muestran como Ecuación 3 y Ecuación 4.
      Equation 19Ecuación 3
      Equation 20Ecuación 4
      Equation 21es la covarianza del valor de referencia y el valor predicho de la concentración de o-cresol; Equation 22 es la desviación estándar del valor de referencia de la concentración de o-cresol;
      Equation 23es la desviación estándar del valor pronosticado de la concentración de o-cresol.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

El valor previsto de o-cresol Impurity en productos de éter de polifenilo se obtiene mediante espectroscopia de infrarrojo cercano basada en PLSR. La Figura 2 y la Figura 3 muestran respectivamente la fiabilidad del método en la etapa de selección de características a partir de la curva del coeficiente de decisión y el porcentaje de interpretación de errores aumentando con el número de componentes principales.

En concreto, tenga en cuenta que en la selección de los componentes principales, con el fin de minimizar la complejidad del modelo, en general, cuando los dos indicadores no aumentan significativamente con el número de elementos principales, los elementos principales posteriores con menos información pueden descartarse. En este documento, según las Equation 1 dos curvas, cuando es 0.9917, es el umbral para descartar componentes principales posteriores.

Pruebe visualmente la precisión y estabilidad del método para predecir la pureza de los productos o-cresol por medio de la Figura 4 y la Figura 5. Basándonos en el conjunto de entrenamiento y el conjunto de pruebas generados por las muestras de o-cresol obtenidas del campo industrial y sus correspondientes datos de espectroscopia de infrarrojo cercano, comparamos el error cuadrado residual y medio de los valores predichos y de referencia de la pureza de los productos de éter de polifenilo.

El residuo aquí se refiere a la diferencia entre el valor de referencia del contenido o-cresol y la estimación del modelo PLSR (valor ajustado). El uso de la información proporcionada por los residuos puede ayudarnos a examinar la racionalidad de los supuestos del modelo PLSR establecidos y la fiabilidad de la recopilación de datos espectrales de infrarrojo cercano. Se muestra que el método PLSR reduce eficazmente los residuos a un rango aceptable. Además, el PLSR tiene un pequeño rango de fluctuación de -0,2 a 0,2, mientras que el rango de calibración es de 42.1063 mg/1 g de producto de éter de polifenilo a 51.6763 mg/1 g de producto de éter de polifenilo. Los datos de la gráfica residual nos permiten concluir cualitativamente que el PLSR para la medición del contenido de o-cresol basado en los datos espectrales NIR tiene una alta precisión.

El error cuadrado medio de validación cruzada es una medida del grado de diferencia entre la referencia y el contenido de o-cresol previsto. Esto puede ayudarnos a evaluar el grado de cambio en los datos predictivos. Cuanto menor sea el valor de MSE, mejor será la precisión del modelo predictivo que describe el contenido de o-cresol. La Figura 5 indica que el MSPECV para la medición de la concentración de o-cresol basado en el PLSR disminuye a medida que aumenta el número de componentes principales y alcanza un mínimo aceptable en 10 componentes principales. Además, el error disminuye significativamente y el proceso de descenso es relativamente estable. Esto demuestra que el PLSR da como resultado una alta estabilidad para la medición de la concentración de o-cresol utilizando NIRS.

Los indicadores de evaluación del modelo para una validación cruzada de 10 veces se muestran en el Cuadro 1. El Equation 1 de 0.98332 es bastante alto para el PLSR, lo que indica que el modelo basado en el PLSR refleja bien la relación lineal entre los datos espectrales NIR y la concentración de o-cresol (es decir, el modelo tiene una potencia explicativa más fuerte). El coeficiente Equation 2 de correlación de Pearson es una estadística utilizada para reflejar el grado de correlación lineal entre dos variables. Cuanto mayor sea Equation 2 el valor absoluto de , más fuerte será la correlación. Esto puede ayudar a observar cuantitativamente una correlación lineal entre el valor de contenido de o-cresol predicho y el valor de referencia química para confirmar la fiabilidad del modelo. El error de predicción relativo medio (MRPE) de 0.01106 es Equation 2 muy bajo para el PLSR y el coeficiente de correlación de predicción de 0.99161 es grande; por lo tanto, el modelo PLSR es de gran estabilidad y precisión de predicción.

Figure 1
Figura 1. Espectro NIR original tomado con espectrómetro FT-NIR. La figura muestra el dataset espectral no preprocesado recopilado durante un período de tiempo por el espectrómetro FT-NIR. Haga clic aquí para ver una versión más grande de esta figura.

Figure 2
Figura 2. Coeficiente de determinación para la concentración de o-cresol determinada por PLSR. La figura muestra la tendencia del coeficiente de determinación para la concentración de o-cresol con un número creciente de componentes. Haga clic aquí para ver una versión más grande de esta figura.

Figure 3
Figura 3. Variación porcentual explicada en los datos espectrales NIR para el PLSR. La figura muestra la varianza porcentual explicada en los datos espectrales NIR para los componentes principales bajo el PLSR. Haga clic aquí para ver una versión más grande de esta figura.

Figure 4
Figura 4. Residual del PLSR para el conjunto de pruebas. La figura muestra los residuos de las 200 muestras del conjunto de pruebas para el PLSR. Haga clic aquí para ver una versión más grande de esta figura.

Figure 5
Figura 5. MSPECV del PLSR. La precisión del modelo PLSR se evaluó con una validación cruzada de 10 veces; el MSPECV del modelo se muestra en la Figura 5. Haga clic aquí para ver una versión más grande de esta figura.

Interpretabilidad Precisión de predicción
PLSR R2 Rp MRPECV
0.98332 0.9916 0.01106

Tabla 1. Los índices de evaluación del modelo. El Cuadro 1 muestra los indicadores de evaluación del modelo para una validación cruzada de 10 veces.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Este protocolo describe el proceso de realización del PLSR en la medición de la concentración de o-cresol restante en el producto líquido de éter de polifenileno con NIRS.

Los dos pasos críticos en este proceso son el preprocesamiento de los datos espectrales NIR originales y la selección de variables de los datos espectrales NIR de alta dimensión.

Generalmente, la interferencia de fondo no sistemática conduce a la desviación de dispersión no sistemática o a la deriva de referencia del espectro NIR. El método de preprocesamiento espectral NIR adecuado (derivado, normalización, corrección de dispersión multivariante, etc.), como primer paso crítico, elimina la interferencia de fondo y aumenta la relación señal-ruido de los datos.

Múltiples correlaciones lineales existentes en los datos espectrales NIR de alta dimensión introducen cálculos innecesarios y reducen la eficiencia operativa del modelo de regresión. Además, hay variables redundantes que tienen una correlación débil o incluso ninguna con el contenido de o-cresol en productos de éter de polifenilo líquido. La selección variable basada en PLS, como segundo paso crítico, resuelve los dos problemas anteriores, lo que reduce la complejidad del modelo y mejora su robustez en comparación con el uso directo de OLSR para el modelado.

Además, la tecnología tiene sus limitaciones como las siguientes. En primer lugar, requiere que no haya una correlación no lineal significativa entre las diversas variables dimensionales de los datos espectrales NIR. Como el mecanismo del algoritmo PLS se basa en la expectativa de maximizar la varianza de las variables de datos espectrales NIR y maximizar la correlación de Pearson entre el componente principal seleccionado y el contenido de o-cresol. Por lo tanto, el funcionamiento del algoritmo en los datos es esencialmente una combinación lineal de variables de alta dimensión, que no incluye la posible relación no lineal entre los datos15. En segundo lugar, debido al modelado sin conexión, no se puede actualizar automáticamente. Nuestro trabajo aún no ha cubierto los efectos de la interacción entre o-cresol y moléculas solventes u otras moléculas de impureza en NIRS. La interacción entre o-cresol y disolventes u otras moléculas de impureza puede tener un efecto inesperado en NIRS, pero todavía no hemos encontrado un método adecuado para cuantificar este efecto. En tercer lugar, el cambio de entorno, la condición de trabajo y otros factores pueden conducir a la deriva conceptual del modelo.

Sin embargo, para los métodos existentes, como el análisis de separación física o química para la medición del contenido de sustancias químicas en la industria de materiales químicos, NIRS detecta la composición y la información estructural sobre el contenido de sustancias químicas perspectiva molecular microscópica. En general, la transición cualitativa a nivel macroscópico es causada por el cambio cuantitativo a nivel microscópico. Por lo tanto, esta tecnología tiene mayor precisión, puntualidad y sensibilidad que otros métodos. Además, la combinación con la tecnología de análisis de datos puede utilizar eficazmente big data industrial, lo que es propicio para la automatización industrial e incluso la construcción inteligente.

En el futuro, esta tecnología se puede aplicar de forma flexible a la medición en línea de diversos contenidos químicos de fase líquida o sólida en otras industrias de procesos finos en las que la medición de sensores generales y la medición de laboratorio es difícil o no puede cumplir los requisitos industriales16. Además, esta tecnología puede combinarse ampliamente con tecnología de control avanzada debido a la retroalimentación en tiempo real de las variables de análisis y así cumplir con los requisitos industriales más altos17,18,19.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen nada que revelar.

Acknowledgments

Este trabajo fue apoyado por la National Natural Science Foundation of China (Grant Nos. 61722306 y 61473137) y el National First First-class Discipline Program of Light Industry Technology and Engineering (LITE2018-025).

Materials

Name Company Catalog Number Comments
MPA II Multi Purpose FT-NIR Analyzer Bruker 1
Fiber Optic Probes(Liquid phase) Bruker 1
Liquid chromatography analyzer  / 1
Laboratory Equipment and Supplies(e.g. test tube, etc.) /
MATLAB MathWork 1
OPUS Bruker 1
Principal computer DELL 1
The Unscrambler CAMO 1

DOWNLOAD MATERIALS LIST

References

  1. Nicolai, B. M., et al. Nondestructive measurement of fruit and vegetable quality by means of NIR spectroscopy: A review. Postharvest Biology and Technology. 46, (2), 99-118 (2007).
  2. Chang, C. W., Laird, D. A., Mausbach, M. J., Hurburgh, C. R. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties. Soil Science Society of America Journal. 65, (2), 480-490 (2001).
  3. Chen, Y., et al. Near-infrared spectroscopy for rapid evaluation of different processing products of Sophora japonica. L. Spectroscopy Letters. 51, (1), 37-44 (2018).
  4. Cayuela, J. A., Garcia, J. F. Nondestructive measurement of squalene in olive oil by near infrared spectroscopy. LWT-FOOD SCIENCE AND TECHNOLOGY. 88, 103-108 (2018).
  5. Joaquim, M. Polyphenyl Ether Lubricants. Synthetic Lubricants and High-performance Functional. Rudnick, R. L., Shubkin, R. L. Marcel Dekker, Inc. NY. 239 (1999).
  6. Grabowska, H., Kaczmarczyk, W., Wrzyszcz, J. Synthesis of 2,6-Xylenol by Alkylation of Phenol with Methanol. Applied Catalysis. 47, (2), 351-355 (1989).
  7. Jeon, D. B., et al. Determination of volatile organic compounds, catechins, caffeine and theanine in Jukro tea at three growth stages by chromatographic and spectrometric methods. FOOD CHEMISTRY. 219, 443-452 (2016).
  8. Davidyuk, E. I., Demchenko, V. F., Klisenko, M. A. Rapid group separation and identification of chlorinated organic compounds by high performance liquid chromatography. JOURNAL OF ANALYTICAL CHEMISTRY. 52, (11), 1058-1065 (1997).
  9. Rinnan, A., Berg, F., Engelsen, S. B. Review of the most common pre-processing techniques for near-infrared spectra. TrAC Trends in Analytical Chemistry. 28, (10), 1201-1222 (2009).
  10. Zou, X. B., Zhao, J. W., Povey, M. J. W., Holmes, M., Mao, H. P. Variables selection methods in near-infrared spectroscopy. Analytica Chimica Acta. (1-2), 14-32 (2010).
  11. Dunn, B. W., Beecher, H. G., Batten, G. D., Ciavarella, S. The potential of near-infrared reflectance spectroscopy for soil analysis - a case study from the Riverine Plain of south-eastern Australia. Australian Journal of Experimental Agriculture. 42, (5), 607-614 (2002).
  12. Wang, C. K., Zhang, T. L., Pan, X. Z. Potential of visible and near-infrared reflectance spectroscopy for the determination of rare earth elements in soil. Geoderma. 306, 120-126 (2017).
  13. Gatius, F., Miralbes, C., David, C., Puy, J. Comparison of CCA and PLS to explore and model NIR data. Chemometrics and Intelligent Laboratory Systems. 76-82 (2017).
  14. Wold, S., Sjostrom, M., Eriksson, L. PLS-regression: a basic tool of chemometrics. Chemometrics & Intelligent Laboratory. 58, (2), 109-130 (2001).
  15. Douglas, R. K., Nawar, S., Alamar, M. C., Mouazen, A. M., Coulon, F. Rapid prediction of total petroleum hydrocarbons concentration in contaminated soil using vis-NIR spectroscopy and regression techniques. SCIENCE OF THE TOTAL ENVIRONMENT. 616, 147-155 (2017).
  16. Grassi, S., Alamprese, C. Advances in NIR spectroscopy applied to process analytical technology in food industries. CURRENT OPINION IN FOOD SCIENCE. 22, (SI), 17-21 (2018).
  17. Trung, T., Downes, G., Meder, R., Allison, B. Pulp mill and chemical recovery control with advanced analysers - from trees to final product. APPITA. 68, (1), 39-46 (2015).
  18. Vann, L., Sheppard, J. Use of near-infrared spectroscopy (NIRs) in the biopharmaceutical industry for real-time determination of critical process parameters and integration of advanced feedback control strategies using MIDUS control. Journal of Industrial Microbiology& Biotechnology. 44, (12), 1589-1603 (2017).
  19. Modrono, S., Soldado, A., Martinez-Fernandez, A., de la Roza-Delgado, B. Handheld NIRS sensors for routine compound feed quality control: Real time analysis and field monitoring. TALANTA. 162, 597-603 (2017).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics