O-cresol Concentration Online Measurement Based On Near Infrared Spectroscopy Via Partial Least Square Regression

Engineering

Your institution must subscribe to JoVE's Engineering section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

Le protocole décrit une méthode de prévision de la concentration d'o-cresol pendant la production de l'éther de polyphénylène utilisant la spectroscopie proche infrarouge et la régression partielle de moins de carrés. Pour décrire le processus plus clairement et complètement, un exemple de prédiction de la concentration d'o-cresol pendant la production de polyphénylène est utilisé pour clarifier les étapes.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Chen, Z., Zheng, N., Luan, X., Liu, F. O-cresol Concentration Online Measurement Based On Near Infrared Spectroscopy Via Partial Least Square Regression. J. Vis. Exp. (153), e59077, doi:10.3791/59077 (2019).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Contrairement aux variables de processus macroscopiques, la spectroscopie proche infrarouge fournit des informations sur les processus au niveau moléculaire et peut améliorer considérablement la prédiction des composants dans les processus industriels. La capacité d'enregistrer des spectres pour les échantillons solides et liquides sans aucun prétraitement est avantageuse et la méthode est largement utilisée. Cependant, les inconvénients de l'analyse des données spectrales à infrarouge proche de haute dimension comprennent la redondance de l'information et la multicollinedes des données spectrales. Ainsi, nous proposons d'utiliser la méthode partielle de régression des moindres carrés, qui a traditionnellement été utilisée pour réduire la dimensionnalité des données et éliminer la collinearité entre les caractéristiques d'origine. Nous mettons en œuvre la méthode pour prédire la concentration d'o-cresol pendant la production de l'éther de polyphénylène. L'approche proposée offre les avantages suivants par rapport aux méthodes de prédiction de régression des composants : 1) la régression partielle des moindres carrés résout le problème de multicollinerité des variables indépendantes et évite efficacement le surajustement, qui se produit dans un l'analyse de régression due à la forte corrélation entre les variables indépendantes; 2) l'utilisation des spectres proche infrarouge entraîne une grande précision parce qu'il s'agit d'une méthode non destructive et non polluante pour obtenir de l'information à des échelles microscopiques et moléculaires.

Introduction

La spectroscopie infrarouge proche (NIR) a été largement acceptée en tant que technologie d'analyse moderne rapide, efficace, non destructive et non polluante; la méthode a été utilisée au cours des dernières années pour la détection et l'analyse de la qualité des produits et la mesure des composants chimiques dans les procédés industriels. La spécialité la plus essentielle de la méthode est sa capacité à enregistrer des spectres pour les échantillons solides et liquides sans aucun pré-traitement, ce qui rend NIRS particulièrement adapté à la détection directe et rapide et l'analyse des produits naturels et synthétiques1,2. Contrairement aux capteurs traditionnels qui mesurent les variables du processus (p. ex. température, pression, niveau de liquide, etc.) à une échelle macroscopique et subissent inévitablement le bruit extérieur et l'interférence de fond, le NIRS détecte les informations structurelles de la composition chimique à des échelles microscopiques et moléculaires. Ainsi, l'information essentielle peut être mesurée avec plus de précision et de efficacité qu'avec d'autres méthodes3,4.

L'éther de polyphényle, comme l'un des plastiques d'ingénierie, sont largement employés en raison de sa résistance à la chaleur, retardant la flamme, isolation, propriétés électriques, stabilité dimensionnelle, résistance d'impact, résistance de fluage, force mécanique et d'autres propriétés5. Plus important encore, il est non toxique et inoffensif par rapport à d'autres plastiques d'ingénierie. À l'heure actuelle, 2,6-xylenol est l'une des matières premières de base pour la synthèse de l'éther de polyphénylène, et il est généralement préparé par alkylation catalysée du phénol avec la méthode de méthanol6. Il existe deux produits principaux de cette méthode de préparation, o-cresol et 2,6-xylenol. Après une série d'étapes de séparation et d'extraction, 2,6 xylenol est utilisé pour produire de l'éther de polyphénylène. Cependant, des quantités infimes d'o-cresol demeurent dans 2,6-xylenol. O-cresol ne participe pas à la synthèse de l'éther de polyphénylène et restera dans le produit d'éther de polyphénylène, ayant pour résultat une diminution de la qualité du produit ou même de la qualité inférieure. À l'heure actuelle, la plupart des entreprises analysent encore les compositions de mélanges organiques complexes tels que les produits d'éther de polyphényle de phase liquide contenant des impuretés (p. ex., o-cresol) par analyse de séparation physique ou chimique comme la chromatographie7,8. Le principe de séparation de la chromatographie est l'utilisation du mélange des compositions dans la phase fixe et la phase de flux dans la dissolution, l'analyse, l'adsorption, la desorption ou toute autre affinité des différences mineures dans la performance. Lorsque les deux phases se déplacent l'une par rapport à l'autre, les compositions sont séparées par les actions ci-dessus à plusieurs reprises dans les deux phases. Selon l'objet, il faut généralement quelques minutes à quelques dizaines de minutes pour effectuer une opération complexe de séparation des matériaux. On peut voir que l'efficacité de mesure est faible.

Aujourd'hui, la mesure de la qualité du produit et la technologie de contrôle avancée basée sur cette analyse pour l'industrie moderne des matériaux chimiques de procédé fin est la direction clé pour améliorer davantage la qualité du produit. Dans l'industrie des procédés de production d'éther de polyphényle, la mesure en temps réel de la teneur en o-crésol dans le produit d'éther de polyphénylène est d'une grande importance de développement. L'analyse chromatographique ne peut manifestement pas répondre aux exigences de la technologie de contrôle avancée pour la mesure en temps réel des substances et la rétroaction du signal. Par conséquent, nous proposons la méthode partielle de régression des moindres carrés (PLSR) pour établir un modèle linéaire entre les données NIRS et la concentration o-cresol, qui réalisent la mesure en ligne de la teneur en o-cresol dans le produit d'éther de polyphénylène liquide de sortie .

Le prétraitement du NIRS joue le rôle le plus important avant la modélisation statistique multivariée. Le nombre d'ondes NIRS dans le spectre NIR et la taille des particules des échantillons biologiques sont comparables, de sorte qu'il est connu pour les effets de dispersion inattendus qui ont une influence sur les spectres de l'échantillon enregistré. En exécutant des méthodes de prétraitement appropriées, ces effets sont faciles à éliminer en grande partie9. Les techniques de prétraitement les plus couramment utilisées dans le NIRS sont classées comme la correction de la diffusion et les méthodes dérivées spectrales. Le premier groupe de méthodes comprend la correction de dispersion multiplicative, la tendance, les transformations variates normales standard et la normalisation. Les méthodes de dérivation spectrale comprennent l'utilisation des premier et deuxième dérivés.

Avant d'élaborer un modèle de régression quantitative, il est important de supprimer les variations de dispersion non systématiques des données du NIRS parce qu'elles ont une influence significative sur l'exactitude du modèle prédictif, sa complexité et sa parcimonie. Le choix d'une méthode de prétraitement appropriée doit toujours dépendre de l'étape de modélisation ultérieure. Ici, si l'ensemble de données spectrales NIR ne suit pas la loi Lambert-Beer, alors d'autres facteurs tendent à compenser le comportement non idéal de la prédiction des composants prédits. L'inconvénient de l'existence de tels facteurs inutiles conduit à l'augmentation de la complexité du modèle, même très probablement, une réduction de la robustesse. Ainsi, l'application de dérivés spectrals et une normalisation conventionnelle des données spectrales est une partie essentielle de la méthode.

Après le prétraitement spectral, les données NIRS avec un rapport signal-bruit élevé et une faible interférence de fond sont obtenues. L'analyse Moderne de NIRS fournit l'acquisition rapide de grandes quantités d'absorption sur une gamme spectrale appropriée. La composition chimique de l'échantillon est ensuite prédite en extrayant les variables pertinentes à l'aide de l'information contenue dans la courbe spectrale. En général, NIRS est combiné avec des techniques d'analyse multivariées pour les analyses qualitatives ou quantitatives10. Une analyse multivariée de régression linéaire (MLR) est couramment utilisée pour développer et extraire la relation mathématique entre les données et les composants dans les processus industriels et a été largement utilisée dans l'analyse Du NIRS.

Cependant, il y a deux problèmes fondamentaux lors de la mise en œuvre d'un MLR pour les données NIRS prétraitées. Un problème est la redondance variable. La dimensionnalité élevée des données NIRS rend souvent la prédiction d'une variable dépendante peu fiable parce que les variables sont incluses qui n'ont aucune corrélation avec les composants. Ces variables redondantes réduisent l'efficacité de l'information des données spectrales et affectent l'exactitude du modèle. Afin d'éliminer la redondance variable, il est essentiel de développer et de maximiser la corrélation entre les données Du NIRS et les composants prévus.

Un autre problème est la question de la multicollinearité dans les données Du NIRS. L'une des hypothèses importantes des modèles de régression linéaire multiple est qu'il n'y a pas de relation linéaire entre l'une des variables explicatives du modèle de régression. Si cette relation linéaire existe, il est prouvé qu'il y a multicollinearity dans le modèle de régression linéaire et l'hypothèse est violée. Dans les régressions linéaires multiples, telles qu'une régression ordinaire des moindres carrés (OLSR), les corrélations multiples entre les variables affectent l'estimation du paramètre, augmentent l'erreur du modèle et affectent la stabilité du modèle. Pour éliminer la corrélation multilinéaire entre les données spectrales NIR, nous utilisons des méthodes de sélection variables qui maximisent la variabilité inhérente des échantillons.

Ici, nous proposons d'utiliser le PLSR, qui est une généralisation de la régression linéaire multiple qui a été largement utilisé dans le domaine de NIRS11,12. Le PLSR intègre les fonctions de base du MLR, de l'analyse canonique de corrélation (CCA) et de l'analyse des composants principaux (PCA) et combine l'analyse de prévision avec une analyse de connotation de données non-modèle. Le PLSR peut être divisé en deux parties. La première partie sélectionne les composants des variables caractéristiques et les composants prévus par analyse partielle des moindres carrés (PLS). PLS maximise la variabilité inhérente des composants principaux en rendant la covariance des principaux composants et des composants prévus aussi grand que possible lors de l'extraction des principaux composants. Ensuite, le modèle OLSR de concentration d'o-cresol est établi pour les principaux composants sélectionnés. PLSR convient à l'analyse de données bruyantes avec de nombreuses variables indépendantes qui sont fortement collinear et fortement corrélées et pour la modélisation simultanée de plusieurs variables de réponse. En outre, PLSR extrait l'information efficace des spectres d'échantillon, surmonte le problème de la multicollinearité, et a les avantages d'une forte stabilité et d'une haute précision de prédiction13,14.

Le protocole suivant décrit le processus d'utilisation du modèle PLSR pour mesurer la concentration d'o-cresol à l'aide de données spectrales NIR. La fiabilité et l'exactitude du modèle sont évaluées quantitativement en utilisant le coefficient de détermination (Equation 1), le coefficient de corrélation de prédiction (Equation 2) et l'erreur de prédiction carrée moyenne de la validation croisée (MSPECV). De plus, pour montrer intuitivement les avantages du PLSR, les indicateurs d'évaluation sont visualisés en plusieurs parcelles pour une analyse qualitative. Enfin, les indicateurs d'évaluation d'une expérience sont présentés sous forme de tableau pour illustrer quantitativement la fiabilité et la précision du modèle PLSR.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Acquisition de données de spectre NIR avec spectromètre de processus de transformation Fourier (FT)-NIR

  1. Installez la sonde de fibre optique de phase liquide du spectromètre proche infrarouge à la sortie du produit d'éther de polyphényle. Et ouvrez le logiciel OPUS sur l'ordinateur supérieur connecté à l'instrument et commencez à configurer la mesure.
  2. Connexion au spectromètre
    1. Dans le menu Mesure, sélectionnez la commande Deconfiguration optique et service, ou cliquez sur l'icône à partir de la barre d'outils.
    2. Sur le dialogue qui s'ouvre, cliquez sur l'onglet Banc optique .
    3. Vérifiez si les paramètres du spectromètre sont corrects. Si oui, fermez le dialogue. Si non, continuez avec l'étape 4.
    4. Dans la liste de déroulant configuration, sélectionnez le type de spectromètre particulier.
    5. Entrez l'adresse IP du spectromètre dans le champ d'entrée de l'URL du banc optique.
    6. Cliquez sur le bouton Connect.
  3. Configuration des paramètres de mesure
    1. Dans le menu Mesure, sélectionnez la commande Mesure ou cliquez sur l'icône à partir de la barre d'outils.
    2. Sur le dialogue qui s'ouvre, définissez les paramètres de mesure sur les différents onglets.
      REMARQUE : Les détails sur les paramètres de mesure individuels sont décrits dans le manuel de référence OPUS.
    3. Cliquez sur le bouton Accepter et sortir.
  4. Stockage du fichier d'expérience
    1. Dans le menu Mesure, sélectionnez la commande de mesure avancée. Ensuite, cliquez sur l'onglet Advanced.
    2. Sur le dialogue qui s'ouvre, définissez la résolution comme 4 cm-1.
    3. Définissez le nombre d'analyses en tant que 16 scans dans les champs d'entrée de l'échantillon/analyse de fond.
    4. Définir le chemin pour stocker automatiquement les données de mesure de 4 000 cm-1-12 500 cm-1.
    5. Déterminer le type de données pour le spectre de résultat comme Absorbance.
    6. Cliquez sur le bouton Enregistrer.
    7. Sur le dialogue qui s'ouvre, définissez un nom pour le fichier d'expérience et enregistrez ce nom.
  5. Mesure du spectre de fond
    1. Dans le menu Mesure, sélectionnez la commande de mesure avancée.
    2. Cliquez sur l'onglet Optique.
    3. Sur le dialogue qui s'ouvre, cliquez sur la liste de dénotation de réglage d'ouverture et sélectionnez la même valeur utilisée pour acquérir un spectre d'échantillon.
    4. Cliquez sur l'onglet Base.
    5. Sur le dialogue qui s'ouvre, cliquez sur le bouton Contexte Single Channel.
  6. Mesure du spectre de l'échantillon
    1. Placez l'échantillon dans la trajectoire optique du spectromètre. La façon dont cela est fait dépend de la configuration du spectromètre.
    2. Dans le menu Mesure, sélectionnez la commande de mesure avancée.
    3. Cliquez sur l'onglet Base.
    4. Sur le dialogue qui s'ouvre, définissez la description de l'échantillon et le formulaire d'échantillon dans le champ d'entrée particulier. Ces informations sont stockées avec le spectre.
    5. Cliquez sur le bouton Exemple de canal unique pour commencer la mesure en ligne. Et enregistrer le spectre NIR de chaque analyse que le fichier OPUS.
  7. Recueillir les échantillons de polyphénylène tous les 6 h et tester la concentration d'o-cresol avec chromatographie liquide dans le laboratoire de l'industrie pour obtenir une valeur de référence chimique.
    REMARQUE : Le personnel de laboratoire du champ de l'industrie prend chaque échantillon d'éther de polyphényle de la sortie de l'éther de polyphényle de phase liquide. La teneur en o-cresol dans chaque échantillon a été mesurée trois fois par chromatographie liquide. Ensuite, la valeur moyenne des résultats de l'analyse à trois reprises a été prise comme valeur de référence de la teneur en o-cresol pour réduire l'erreur accidentelle.
  8. Obtenir 600 valeurs de référence chimiques de concentration d'o-cresol en laboratoire. La gamme d'étalonnage de la concentration d'o-cresol est de 42.1063 mg/1 g produit d'éther de polyphényle à 51.6763 mg/1 g produit d'éther de polyphényle.
  9. Combinez les spectres NIR aux heures d'essai données avec les valeurs de référence chimiques de la concentration d'o-cresol.
  10. Utilisez le logiciel OPUS pour lire l'ensemble spectral original comme indiqué dans la figure 1.
    1. Dans le menu Fichier, cliquez sur la commande Du fichier de charge.
    2. Sur le dialogue qui s'ouvre, sélectionnez le fichier de spectre particulier.
    3. Cliquez sur le bouton Ouvrez. Le spectre est affiché dans la fenêtre du spectre.

2. Pré-traitement des données de spectroscopie NIR

  1. Avec la fonction de prétraitement spectral, obtenir un jeu de données spectrales prétraité avec un dérivé de premier ordre.
    1. Ouvrez Le Unscrambler qui est un logiciel multivarié d'analyse de données et de conception expérimentale, sélectionnez la commande d'importation sous Fichier. Importer le fichier OPUS comme jeu de données spectrales NIR d'origine.
    2. Sélectionnez Transformer la commande sous Modifier. Et sélectionnez les dérivés Savitzky Golay sous Dérivés.
    3. Définir les échantillons et les variables comme tous les échantillons et toutes les variables dans la portée. Et définir le nombre de points de lissage comme 13 et le dérivé comme1er dérivé dans paramètres.
    4. Cliquez OK pour démarrer le dérivé.
      CAUTION: L'augmentation de la douceur peut réduire les fortes fluctuations de la courbe, réduire l'effet de bruit, mais aussi affaiblir les caractéristiques de la courbe et de rendre la courbe déformée. Par conséquent, la douceur appropriée choisie en fonction de l'observation de l'intensité réelle de fluctuation de la courbe et de l'effet après le traitement.
  2. Effectuer une normalisation vectorielle sur les spectres de l'échantillon pour normaliser la valeur de l'absorption.
    1. Sélectionnez la commande de normalisation sous Modifier.
    2. Définir les échantillons et les variables comme tous les échantillons et toutes les variables dans la portée.
    3. Sélectionnez la normalisation vectorielle dans le type.
    4. Cliquez sur OK pour effectuer la normalisation des vecteurs.

3. Établissement du modèle PLSR

  1. Création de l'ensemble de données spectrales NIR
    1. Ouvrez Uncrambler. exe, sélectionnez Export under File avec les fichiers Matlab pour exporter les données spectrales prétraitées dans le fichier .mat et pour obtenir automatiquement l'ensemble de données spectrales X avec 2203 variables.
    2. Obtenir un ensemble de données spectrales NIR complet X (une matrice de 600 lignes et 2203 colonnes) et les valeurs de référence chimiques correspondantes Y (un vecteur de 600 lignes) sous la forme d'un fichier .mat pour l'analyse et la modélisation ultérieures.
  2. Sélection du nombre approprié de composants principaux
    1. Ouvrez Matlab et importez le fichier .mat contenant les données spectrales pré-traitées proche infrarouge dans l'espace de travail en faisant glisser le fichier .mat dans l'espace de travail.
      REMARQUE : Le fichier .mat stocke les données spectrales proche infrarouge X comme variable indépendante et la teneur en o-cresol du produit en tant que variable dépendante sous la forme de deux matrices.
    2. Ouvrez le fichier .m programmé dans l'éditeur. Cliquez sur Ouvrez sous l'option Éditeur, sélectionnez le fichier .m compilé dans l'annuaire de stockage de fichiers, puis cliquez sur Confirmer.
    3. Extraire 15 composants principaux selon l'objectif d'optimisation de l'équation 1 et du modèle OLSR entre les composants principaux extraits et les valeurs prévues de la concentration d'o-cresol avec le programme contenant le plsrégresse de commande() dans Matlab.
      [XL, YL, XS, YS, BETA, PCTVAR, MSE] - plsregress(X,Y,ncomp,'CV',k);
      Consultez le document d'aide MATLAB pour obtenir les détails d'utilisation et la valeur de retour.
      REMARQUE: Equation 3 Équation 1Equation 4
      Equation 5, Equation 6 et est le ie principaux composants des données spectrales NIR;
      Equation 7est la projection des principaux composants ith des données spectrales NIR;
      Equation 8est le coefficient de corrélation Pearson pour les composants principaux ith et la concentration d'o-cresol.
    4. Obtenir Equation 1 la valeur des données spectrales NIR et les valeurs prévues pour les différents composants principaux à l'aide de l'équation 2.
      REMARQUE: Equation 9 Équation 2
      Equation 10est la somme des carrés dus Equation 11 à l'erreur et est définie comme ;
      Equation 12est la somme totale des carrés Equation 13 et est définie comme ;
      Equation 14est la valeur de référence de la concentration o-cresol de l'ensemble de données d'essai;
      Equation 15est la valeur prévue de la concentration o-cresol de l'ensemble de données d'essai;
      Equation 16est la valeur moyenne de la valeur de référence de la concentration o-cresol de l'ensemble de données d'essai;
      Equation 17est le nombre d'échantillons de données d'essai.
    5. Déterminer Equation 1 les valeurs et la tendance avec l'augmentation du nombre de composantes principales comme le montre la figure 2. Sélectionnez 10 comme nombre approprié de Equation 1 composants principaux d'une valeur de 0,9917.
      REMARQUEEquation 18 : la valeur est la proportion de la variance dans la variable dépendante qui est prévisible par les variables indépendantes. Plus la Equation 1 valeur est élevée, plus la bonté de l'ajustement est élevée et vice versa.
  3. Validation de la bonté de l'ajustement et de la précision du modèle PLSR avec 10 composants principaux en utilisant la commande plsregress().
    1. Répétez le processus de modélisation avec 10 composants principaux en tant qu'étapes 3.2.1-3.2.5 avec 10 composants principaux.
    2. Évaluer le modèle à partir d'une validation croisée 10 fois à l'aide des parcelles de la variance pour cent expliquées dans les données spectrales NIR, les résidus et le MSPECV.
    3. Tracer la variance pour cent expliquée dans les données spectrales NIR, les résidus, et le MSPECV comme Figures 3, 4, et 5.
    4. Tabulate les indicateurs Equation 1 d'évaluation de ,Equation 2, et MSPE de validation croisée 10 fois pour le modèle PLSR pour une analyse quantitative comme indiqué dans le tableau 1.
      REMARQUE: Les équations de Equation 2 et MSPE sont présentées comme l'équation 3 et l'équation 4.
      Equation 19Équation 3
      Equation 20Équation 4
      Equation 21est la covariance de la valeur de référence et de la valeur prévue de la concentration d'o-cresol; Equation 22 est l'écart standard de la valeur de référence de la concentration d'o-cresol;
      Equation 23est l'écart standard de la valeur prévue de la concentration d'o-cresol.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

La valeur prévue de l'impureté o-cresol dans les produits d'éther de polyphényle est obtenue par la spectroscopie proche infrarouge basée sur PLSR. La figure 2 et la figure 3 montrent respectivement la fiabilité de la méthode à l'étape de sélection des entités à partir de la courbe du coefficient de décision et du pourcentage d'interprétation des erreurs qui augmente avec le nombre de composants principaux.

Plus précisément, veuillez noter que dans la sélection des principaux composants, afin de minimiser la complexité du modèle, en général, lorsque les deux indicateurs n'augmentent pas de façon significative avec le nombre d'éléments principaux, les principaux éléments suivants avec moins d'information peuvent être écartés. Dans ce document, selon les deux Equation 1 courbes, quand est 0,9917, c'est le seuil pour jeter les composants principaux suivants.

Testez visuellement la précision et la stabilité de la méthode de prévision de la pureté des produits o-cresol au moyen de la figure 4 et de la figure 5. Sur la base de l'ensemble de formation et de l'ensemble d'essai générés par les échantillons d'o-cresol obtenus à partir du champ industriel et de leurs données de spectroscopie proche infrarouge correspondantes, nous avons comparé l'erreur carrée résiduelle et moyenne des valeurs prédites et de référence de la pureté des produits d'éther polyphényle.

Le résidu ici se réfère à la différence entre la valeur de référence de la teneur en o-cresol et l'estimation du modèle PLSR (valeur ajustée). L'utilisation de l'information fournie par les résidus peut nous aider à examiner la rationalité des hypothèses établies du modèle PLSR et la fiabilité de la collecte de données spectrales proche infrarouge. Il est démontré que la méthode PLSR réduit efficacement les résidus à une plage acceptable. En outre, le PLSR a une petite gamme de fluctuation de -0,2 à 0,2, tandis que la plage d'étalonnage est de 42,1063 mg/1 g produit d'éther polyphényle à 51,6763 mg/1 g produit d'éther polyphényle. Les données résiduelles de parcelle nous admettons qualitativement que le PLSR pour la mesure de la teneur en o-cresol basée sur les données spectrales NIR a une grande précision.

L'erreur carrée moyenne de validation croisée est une mesure du degré de différence entre la référence et le contenu o-cresol prévu. Cela peut nous aider à évaluer le degré de changement dans les données prédictives. Plus la valeur de l'ESM est faible, meilleure est la précision du modèle prédictif décrivant la teneur en o-cresol. La figure 5 indique que le MSPECV pour la mesure de la concentration d'o-cresol en fonction du PLSR diminue à mesure que le nombre de composants principaux augmente et atteint un minimum acceptable à 10 composantes principales. De plus, l'erreur diminue considérablement et le processus de descente est relativement stable. Cela prouve que le PLSR se traduit par une grande stabilité pour la mesure de la concentration d'o-cresol à l'aide de NIRS.

Les indicateurs d'évaluation du modèle pour une validation croisée 10 fois sont indiqués dans le tableau 1. Le Equation 1 0.98332 est assez élevé pour le PLSR, ce qui indique que le modèle basé sur le PLSR reflète bien la relation linéaire entre les données spectrales NIR et la concentration o-cresol (c'est-à-dire, le modèle a une puissance explicative plus forte). Le coefficient Equation 2 de corrélation Pearson est une statistique utilisée pour refléter le degré de corrélation linéaire entre deux variables. Plus la valeur Equation 2 absolue de , plus la corrélation est forte. Cela peut aider à observer quantitativement une corrélation linéaire entre la valeur de la teneur en o-cresol prédite et la valeur de référence chimique pour confirmer la fiabilité du modèle. L'erreur de prédiction relative moyenne (MRPE) de 0,01106 est très faible Equation 2 pour le PLSR et le coefficient de corrélation de prévision de 0,99161 est important; par conséquent, le modèle PLSR est d'une grande stabilité de prédiction et de précision.

Figure 1
Figure 1. Spectre NIR original pris avec spectromètre FT-NIR. La figure montre le jeu de données spectrales non prétraités recueilli sur une période de temps par le spectromètre FT-NIR. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 2
Figure 2. Coefficient de détermination pour la concentration d'o-cresol déterminée par PLSR. La figure montre la tendance du coefficient de détermination pour la concentration o-cresol avec un nombre croissant de composants. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 3
Figure 3. Variation en pourcentage expliquée dans les données spectrales NIR pour le PLSR. Le chiffre montre la variance en pourcentage expliquée dans les données spectrales NIR pour les principaux composants sous le PLSR. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 4
Figure 4. Résiduel du PLSR pour l'ensemble de test. La figure montre les résidus des 200 échantillons d'ensemble d'essai pour le PLSR. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 5
Figure 5. MSPECV du PLSR. La précision du modèle PLSR a été évaluée avec une validation croisée 10 fois; le MSPECV du modèle est indiqué à la figure 5. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Interprétation Précision des prévisions
PLSR PLSR R2 (en) Rp MRPECV (en)
0.98332 0.9916 0.01106

Tableau 1. Indices d'évaluation du modèle. Le tableau 1 montre les indicateurs d'évaluation du modèle pour une validation croisée 10 fois.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Ce protocole décrit le processus d'exécution du PLSR sur la mesure de la concentration d'o-cresol restant dans le produit liquide de l'éther de polyphénylène avec NIRS.

Les deux étapes critiques de ce processus sont le prétraitement des données spectrales NIR originales et la sélection des variables des données spectrales NIR de haute dimension.

En général, l'interférence de fond non systématique conduit à l'écart de diffusion non systématique ou à la dérive de base du spectre NIR. Méthode de prétraitement spectrale NIR appropriée (dérivé, normalisation, correction de diffusion multivariée, etc.), comme première étape critique, élimine les interférences de fond et augmente le rapport signal-bruit des données.

Les corrélations linéaires multiples existantes dans les données spectrales de Haute dimension NIR introduisent le calcul inutile et réduisent l'efficacité de fonctionnement du modèle de régression. En outre, il existe des variables redondantes qui ont une corrélation faible ou même nulle avec la teneur en o-cresol dans les produits d'éther de polyphényle liquide. La sélection variable basée sur PLS, comme deuxième étape critique, résout les deux problèmes ci-dessus, ce qui réduit la complexité du modèle et améliore sa robustesse par rapport à l'utilisation directe de l'OLSR pour la modélisation.

En outre, la technologie a ses limites comme suit. Tout d'abord, il exige qu'il n'y ait pas de corrélation non linéaire significative entre les différentes variables dimensionnelles des données spectrales NIR. Comme le mécanisme d'algorithme PLS est basé sur l'attente de maximiser la variance des variables de données spectrales NIR et de maximiser la corrélation Pearson entre le composant principal sélectionné et le contenu de l'o-cresol. Par conséquent, le fonctionnement de l'algorithme sur les données est essentiellement une combinaison linéaire de variables de haute dimension, qui n'inclut pas la relation non linéaire possible entre les données15. Deuxièmement, en raison de la modélisation hors ligne, il ne peut pas être auto-mis à jour. Nos travaux n'ont pas encore couvert les effets de l'interaction entre les molécules d'o-cresol et de solvant ou d'autres molécules d'impureté sur NIRS. L'interaction entre l'o-cresol et les solvants ou d'autres molécules d'impureté peut avoir un effet inattendu sur NIRS, mais nous n'avons toujours pas trouvé une méthode appropriée pour quantifier cet effet. Troisièmement, le changement d'environnement, de conditions de travail et d'autres facteurs peut entraîner la dérive conceptuelle du modèle.

Toutefois, pour les méthodes existantes telles que l'analyse de séparation physique ou chimique pour la mesure de la teneur en substances chimiques dans l'industrie des matières chimiques, NIRS détecte la composition et l'information structurelle sur la teneur en substances chimiques à partir d'un perspective moléculaire microscopique. En général, la transition qualitative au niveau macroscopique est causée par le changement quantitatif au niveau microscopique. Par conséquent, cette technologie a une précision, une rapidité et une sensibilité plus fortes que d'autres méthodes. En outre, la combinaison avec la technologie d'analyse de données peut utiliser efficacement le Big Data industriel, qui est propice à l'automatisation industrielle et même la construction intelligente.

À l'avenir, cette technologie peut être appliquée avec souplesse à la mesure en ligne de divers produits chimiques de phase liquide ou solide contenu dans d'autres industries de processus fins où la mesure des capteurs généraux et la mesure de laboratoire est difficile ou incapable de répondre aux exigences industrielles16. En outre, cette technologie peut être largement combinée avec la technologie de contrôle avancée en raison de la rétroaction en temps réel des variables d'analyse et ainsi répondre aux exigences industrielles plus élevées17,18,19.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Les auteurs n'ont rien à révéler.

Acknowledgments

Ces travaux ont été soutenus par la National Natural Science Foundation of China (Grant Nos. 61722306 et 61473137) et le National First-class Discipline Program of Light Industry Technology and Engineering (LITE2018-025).

Materials

Name Company Catalog Number Comments
MPA II Multi Purpose FT-NIR Analyzer Bruker 1
Fiber Optic Probes(Liquid phase) Bruker 1
Liquid chromatography analyzer  / 1
Laboratory Equipment and Supplies(e.g. test tube, etc.) /
MATLAB MathWork 1
OPUS Bruker 1
Principal computer DELL 1
The Unscrambler CAMO 1

DOWNLOAD MATERIALS LIST

References

  1. Nicolai, B. M., et al. Nondestructive measurement of fruit and vegetable quality by means of NIR spectroscopy: A review. Postharvest Biology and Technology. 46, (2), 99-118 (2007).
  2. Chang, C. W., Laird, D. A., Mausbach, M. J., Hurburgh, C. R. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties. Soil Science Society of America Journal. 65, (2), 480-490 (2001).
  3. Chen, Y., et al. Near-infrared spectroscopy for rapid evaluation of different processing products of Sophora japonica. L. Spectroscopy Letters. 51, (1), 37-44 (2018).
  4. Cayuela, J. A., Garcia, J. F. Nondestructive measurement of squalene in olive oil by near infrared spectroscopy. LWT-FOOD SCIENCE AND TECHNOLOGY. 88, 103-108 (2018).
  5. Joaquim, M. Polyphenyl Ether Lubricants. Synthetic Lubricants and High-performance Functional. Rudnick, R. L., Shubkin, R. L. Marcel Dekker, Inc. NY. 239 (1999).
  6. Grabowska, H., Kaczmarczyk, W., Wrzyszcz, J. Synthesis of 2,6-Xylenol by Alkylation of Phenol with Methanol. Applied Catalysis. 47, (2), 351-355 (1989).
  7. Jeon, D. B., et al. Determination of volatile organic compounds, catechins, caffeine and theanine in Jukro tea at three growth stages by chromatographic and spectrometric methods. FOOD CHEMISTRY. 219, 443-452 (2016).
  8. Davidyuk, E. I., Demchenko, V. F., Klisenko, M. A. Rapid group separation and identification of chlorinated organic compounds by high performance liquid chromatography. JOURNAL OF ANALYTICAL CHEMISTRY. 52, (11), 1058-1065 (1997).
  9. Rinnan, A., Berg, F., Engelsen, S. B. Review of the most common pre-processing techniques for near-infrared spectra. TrAC Trends in Analytical Chemistry. 28, (10), 1201-1222 (2009).
  10. Zou, X. B., Zhao, J. W., Povey, M. J. W., Holmes, M., Mao, H. P. Variables selection methods in near-infrared spectroscopy. Analytica Chimica Acta. (1-2), 14-32 (2010).
  11. Dunn, B. W., Beecher, H. G., Batten, G. D., Ciavarella, S. The potential of near-infrared reflectance spectroscopy for soil analysis - a case study from the Riverine Plain of south-eastern Australia. Australian Journal of Experimental Agriculture. 42, (5), 607-614 (2002).
  12. Wang, C. K., Zhang, T. L., Pan, X. Z. Potential of visible and near-infrared reflectance spectroscopy for the determination of rare earth elements in soil. Geoderma. 306, 120-126 (2017).
  13. Gatius, F., Miralbes, C., David, C., Puy, J. Comparison of CCA and PLS to explore and model NIR data. Chemometrics and Intelligent Laboratory Systems. 76-82 (2017).
  14. Wold, S., Sjostrom, M., Eriksson, L. PLS-regression: a basic tool of chemometrics. Chemometrics & Intelligent Laboratory. 58, (2), 109-130 (2001).
  15. Douglas, R. K., Nawar, S., Alamar, M. C., Mouazen, A. M., Coulon, F. Rapid prediction of total petroleum hydrocarbons concentration in contaminated soil using vis-NIR spectroscopy and regression techniques. SCIENCE OF THE TOTAL ENVIRONMENT. 616, 147-155 (2017).
  16. Grassi, S., Alamprese, C. Advances in NIR spectroscopy applied to process analytical technology in food industries. CURRENT OPINION IN FOOD SCIENCE. 22, (SI), 17-21 (2018).
  17. Trung, T., Downes, G., Meder, R., Allison, B. Pulp mill and chemical recovery control with advanced analysers - from trees to final product. APPITA. 68, (1), 39-46 (2015).
  18. Vann, L., Sheppard, J. Use of near-infrared spectroscopy (NIRs) in the biopharmaceutical industry for real-time determination of critical process parameters and integration of advanced feedback control strategies using MIDUS control. Journal of Industrial Microbiology& Biotechnology. 44, (12), 1589-1603 (2017).
  19. Modrono, S., Soldado, A., Martinez-Fernandez, A., de la Roza-Delgado, B. Handheld NIRS sensors for routine compound feed quality control: Real time analysis and field monitoring. TALANTA. 162, 597-603 (2017).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics