Points clés

  • Les modèles ML purement guidés par les données ne peuvent pas extrapoler de façon fiable en dehors de leur domaine d'apprentissage — une limite structurelle, pas un défaut de paramétrage.
  • Les PINNs intègrent les équations physiques (conservation de la masse, cinétiques, équations de transport) comme contraintes dans la fonction de perte — le modèle apprend à respecter la physique, pas seulement à reproduire les données.
  • L'apport réel des PINNs dépend de données spatiales en entrée : sur des capteurs ponctuels, la physique contraint les configurations possibles sans les déterminer univoquement.
  • Les quatre applications principales en génie des procédés : identification de paramètres cinétiques, estimation d'état du procédé, simulation de scénarios et détection d'anomalies avec interprétabilité physique.

Pourquoi l'apprentissage automatique purement guidé par les données ne suffit pas

L'argument en faveur du ML dans l'optimisation des procédés est évident : les comportements non linéaires complexes sont difficiles à modéliser à partir des premiers principes, et les installations modernes génèrent des volumes de données capteurs que l'analyse conventionnelle ne peut pas exploiter pleinement.

L'échec est tout aussi familier pour quiconque a tenté de déployer des modèles purement guidés par les données en production : ils fonctionnent bien à l'intérieur du domaine couvert par les données d'entraînement, et tombent en défaut — souvent spectaculairement — dès que les conditions changent. Un réseau de neurones entraîné sur des données opératoires normales n'a aucune base pour prédire ce qui se passe quand le débit d'aération dépasse de 20 % la plage d'entraînement. Il extrapolera à tort, ou produira des résultats physiquement impossibles.

Davantage de données ne règlent pas ce problème. C'est une faiblesse structurelle des modèles sans représentation interne des lois physiques du système. Un modèle capable d'ajuster des données arbitraires est aussi capable d'ajuster des données physiquement absurdes — et le fera, si elles figurent dans les données d'entraînement.

Ce que les PINNs font différemment

Les réseaux de neurones à contraintes physiques, formalisés par Raissi, Perdikaris et Karniadakis (2019), répondent à cette limitation en intégrant les équations physiques comme contraintes directement dans le processus d'entraînement. La fonction de perte qu'un PINN minimise comporte deux termes :

total = ℒdonnées + λ · ℒphysique

Le terme données pénalise les écarts par rapport aux observations mesurées. Le terme physique pénalise les violations des équations physiques imposées — équations de conservation de la masse, relations cinétiques, équations de transport. Le paramètre λ pondère l'équilibre entre ajustement des données et respect de la physique.

Le résultat est un modèle simultanément cohérent avec les observations et avec les lois physiques. Un écoulement ascendant sans force motrice est exclu. Des bilans de matière violant la conservation sont impossibles. Dans les zones de l'espace d'état sans données d'entraînement, c'est la physique qui guide les prédictions — non une extrapolation incontrôlée.

Quatre raisons font des PINNs une approche particulièrement adaptée au génie des procédés :

  1. Les procédés chimiques obéissent à des lois physiques connues — conservation de la masse, de l'énergie, de la quantité de mouvement — qui peuvent être directement encodées comme contraintes.
  2. Les données de procédé sont toujours incomplètes par rapport à la dimensionnalité du système. La physique compense là où les capteurs ne mesurent pas.
  3. Les procédés opèrent dans des régimes changeants — démarrage, arrêt, variations de charge — que les modèles purement statistiques gèrent mal.
  4. L'interprétabilité est requise en industrie. Un modèle qui prédit une anomalie en précisant quelle équation de conservation est violée est exploitable ; une sortie d'anomalie score opaque ne l'est pas.

Illustration mathématique : PINN sur un problème de convection-diffusion

Prenons l'exemple du transport de matière dans un réacteur décrit par une équation de convection-diffusion. Le réseau approxime le champ de concentration c(x,t) en fonction des coordonnées spatiales et du temps. La fonction de perte totale combine un terme de conditions aux limites et un terme résidu EDP :

données = (1/Nd) Σ |c_prédit(xi, ti) − c_mesuréi

physique = (1/Nf) Σ |∂c/∂t + u·∇c − D·∇²c|²

Le second terme force le réseau à satisfaire l'équation de convection-diffusion en chaque point de collocation, même là où aucune mesure n'est disponible. En zone peu instrumentée, les prédictions restent physiquement cohérentes plutôt que de dériver vers des valeurs numériquement arbitraires.

La condition préalable : pourquoi les données spatiales sont indispensables

La valeur d'un PINN dépend directement de la richesse spatiale des données d'entrée. C'est le point que les présentations marketing de l'IA pour les procédés passent souvent sous silence.

PINN sur capteur ponctuel

  • Modèle temporel des réponses du capteur
  • La physique contraint les configurations possibles sans les déterminer
  • Impossible de localiser les zones mortes ou les gradients de concentration
  • Navier-Stokes sans données spatiales laisse une infinité de solutions possibles

PINN sur données spatiales

  • Modèle de la distribution spatio-temporelle complète
  • La physique sélectionne univoquement l'état physique parmi les solutions compatibles
  • Localisation directe des zones mortes, gradients, transitions de régime
  • Les bilans de masse et de quantité de mouvement sont vérifiables point par point

Pour illustrer : une sonde d'oxygène dissous dans un mélangeur fournit un scalaire. Un PINN entraîné sur cette base peut apprendre comment la sonde réagit à des changements d'agitation ou d'aération — ce qui donne un modèle temporel utile. Mais il ne peut pas localiser où se trouvent les zones mortes, parce que les données d'entraînement ne portent aucune information spatiale. Navier-Stokes contraint les configurations spatiales possibles, mais ne les détermine pas de façon univoque à partir d'un seul scalaire.

Les données spatiales à haute résolution temporelle sont donc une condition nécessaire, pas une option, pour que la physique informe pleinement le modèle — c'est une exigence fondamentale de la Physical AI appliquée aux procédés.

Applications en génie des procédés

1. Identification de paramètres cinétiques

Les PINNs peuvent identifier des paramètres cinétiques de réaction — constantes de vitesse, énergies d'activation, coefficients d'inhibition — directement à partir de données de procédé continues, sans les expériences batch dédiées qu'exige la modélisation cinétique classique. L'intérêt est particulièrement marqué en bioprocédés, où la cinétique cellulaire varie d'un lot à l'autre.

2. Estimation de l'état du procédé

À partir d'un jeu limité de mesures, un PINN avec physique embarquée peut reconstruire l'état complet du procédé — y compris les grandeurs non directement mesurées — avec une fiabilité supérieure à celle de l'interpolation ou des modèles purement statistiques. En colonne de distillation, cela signifie reconstituer des profils complets de composition liquide et vapeur à partir de quelques mesures de température et d'une distribution de rétention sur une section transversale.

3. Simulation de scénarios

Un PINN calibré peut servir de simulateur de substitution pour l'optimisation du procédé : évaluer la réponse prédite du système à des modifications des conditions opératoires — débit d'alimentation, température, agitation, débit de gaz — sans les mettre en œuvre physiquement. C'est le fondement de la régulation prédictive par modèle (MPC), que les PINNs entraînés sur données spatiales peuvent alimenter avec des prédictions physiquement cohérentes.

4. Détection d'anomalies avec interprétabilité physique

Lorsqu'un procédé s'écarte de l'état prédit par son PINN, le type d'écart renseigne directement sur la cause : quelle équation de conservation est violée ? Un écart sur le bilan de masse oriente vers une fuite ou une erreur de mesure ; un écart sur le bilan de quantité de mouvement signale un changement de propriétés des fluides ou de régime d'écoulement. C'est ce qui distingue fondamentalement la détection d'anomalies par PINN du contrôle statistique de procédé classique.

État de l'art et déploiement industriel

La recherche sur les PINNs a connu une croissance rapide depuis les travaux fondateurs de 2019, avec des applications en mécanique des fluides, mécanique des structures et, de façon croissante, en génie chimique. En France, des équipes de l'IFP Énergies nouvelles, du LRGP Nancy et de CentraleSupélec travaillent sur des approches physico-informées pour les procédés chimiques et biotechnologiques. Les principaux journaux de publication sont Computers & Chemical Engineering, Industrial & Engineering Chemistry Research et le Chemical Engineering Journal.

Le déploiement industriel des PINNs en conduite de procédés chimiques en est encore à ses débuts en 2026. Le principal goulot d'étranglement n'est pas la méthodologie de modélisation — c'est la disponibilité des données. La plupart des installations industrielles restent équipées de capteurs ponctuels qui ne peuvent pas fournir les informations spatiales que les PINNs requièrent. L'émergence de capteurs inline à résolution spatiale pour l'industrie crée pour la première fois les conditions techniques de la Physical AI en exploitation continue.

Les données spatiales qui rendent les PINNs opérationnels

Le capteur quantropIQ fournit plus de 1 000 images par seconde sur la section transversale complète — la résolution spatio-temporelle nécessaire pour que la physique informe pleinement le modèle. Pilote de 6 à 12 semaines sur votre procédé.

Discuter d'un pilote Physical AI

Articles connexes

Références et ressources complémentaires

  1. Raissi, M., Perdikaris, P., & Karniadakis, G. E. (2019). Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations. Journal of Computational Physics, 378, 686–707. ScienceDirect →
  2. Cuomo, S. et al. (2022). Scientific machine learning through physics-informed neural networks: Where we are and what's next. Journal of Scientific Computing, 92(88). Springer →
  3. IFP Énergies nouvelles — Travaux sur la modélisation et la simulation des procédés énergétiques et chimiques, including approches physico-informées. IFPEN →
  4. LRGP — Laboratoire Réactions et Génie des Procédés, CNRS / Université de Lorraine. Recherches sur la modélisation hybride des réacteurs chimiques et biochimiques. LRGP →
  5. Société Française de Génie des Procédés (SFGP) — Sessions sur la numérisation, les jumeaux numériques et l'IA pour les procédés. SFGP →
  6. Psichogios, D. C., & Ungar, L. H. (1992). A hybrid neural network-first principles approach to process modeling. AIChE Journal, 38(10), 1499–1511. Travail précurseur sur la modélisation hybride données-physique.
  7. Computers & Chemical Engineering — Journal de référence pour la modélisation numérique et l'IA en génie chimique. ScienceDirect →