Logo
Polytech

IA et Sciences des Matériaux : le rôle du Machine Learning

Jean-Michel Richer (JMR70)

EC Informatique - LERIA - Université d'Angers

Mardi 6 Mai 2025, Conférence Plénière

Polytech, Angers

Logo UA           Logo Fac. Sciences

Plan


  1. Importance de l'IA pour les matériaux
    • Industrie 4.0
    • Exemples d'applications
  2. IA et Apprentissage
    • Intelligence Artificielle
    • Apprentissage Automatique
    • Apprentissage Supervisé, non supervisé, etc



IA et Matériaux

Les matériaux

Enjeux économiques et sécuritaires colossaux

  • construction des matériaux : optimisation des procédés de fabrication (méthodes, alliages)
    • matériaux composites : polymères, céramiques, métaux, nanomatériaux, biomatériaux
    • propriétés mécaniques : durabilité, résistance, fatigue, corrosion, vieillissement
    • propriétés thermiques, électriques, magnétiques, acoustiques
  • prévention des risques (suivi dans le temps):
    • détection des défauts : viellissement, fissures, corrosion, etc
    • détection des pannes : prévention des accidents
    • prédiction des pannes : réduction des coûts de maintenance (arrêt, maintenance, remise en route)

L'IA et le Machine Learning sont des outils puissants pour répondre à ces enjeux

Un Exemple

  • environ $200 000$ à $250 000$ ponts en France
  • rapport sénatorial (2019) : en 2022, $30000$ à $35000$ ouvrages en mauvais état structurel
  • comment faire pour assurer le suivi ?
  • Exemple A review of metallic bridge failure statistics, University of Surrey, UK, ABMAS 2010 :
    • étude statistique sur 164 ponts dont 87 (51 %) ont connu un effondrement total
    • la fatigue est apparue comme le mode de défaillance le plus fréquent dans les cas de ponts métalliques endommagés mais non effondrés

Industrie 4.0

Industrie 4.0

Source Visiativ.com

Industrie 4.0

Industrie 4.0
  • l'OT produit les données en temps réel
  • l'IT les traite et les exploite pour améliorer la performance
  • OT (Operational Technology) : systèmes de contrôle industriel, capteurs, actionneurs
  • IT (Information Technology) : systèmes d’information, gestion des données
  • Cloud : stockage et traitement des données à distance
  • Edge Computing : traitement des données à la source (proximité des capteurs)
  • IoT (Internet of Things) : objets connectés, capteurs intelligents
  • AI (Artificial Intelligence) : algorithmes d’apprentissage automatique, traitement des données
  • Big Data : traitement de grandes quantités de données

Exemple

Prédire des propriétés mécaniques à partir d’images (ténacité à la rupture $K_{IC}$)


  • images de microscopie électronique à balayage
  • nettoyage des images, segmentation pour isoler les grains
  • extraction des caractéristiques : réseau de neurones (CNN)
  • modélisation : régression linéaire, SVM, forêts aléatoires

permettre de gagner du temps et réduire les coûts d’essais destructifs en laboratoire

Fiabilité

  • modèles prédictifs (en prévention) pour la dégradation des matériaux (vieillissement ou corrosion): données historiques, régression, RN
  • maintenance prédictive (en temps réel) afin d'éviter les pannes : exploitation des données de capteurs machine learning pour déterminer les signes précurseurs de défaillance (SVM, arbres des décision)
  • contrôle non destructifs (CND) : imagerie ultrasons, rayons X -> vision, RN pour la détection de fissures
  • jumeaux numériques (Digital Twins) : pour la simulation et la gestion du cycle de vie
  • optimisation de la conception des structures avec des algorithmes génétiques : explorer des centaines de combinaisons de matériaux, de formes

Jumeau numérique Angers

Une modélisation 3D du territoire à la fois référentiel de données et outil d’aide à la décision

  • Connaissance du territoire
  • Simulation à des fins d’aide à la prise de décision ou d’aide au pilotage des politiques publiques
  • Communication et sensibilisation

Application : inondations, aménagement des quartiers, structure/résistance des ponts

Jumeau numérique Angers

jumeau numérique Angers

Maintenance Prédictive

Applications

  • Automobile : Tesla, détection des anomalies (batterie, freins, moteur électrique), une mise à jour logicielle à distance
  • Aéronautique : Airbus, projet Skywise
  • Industrie Pétrolière et Gazière : Shell surveillance des pipelines
  • Ferroviaire : SNCF et l’analyse des voies ferrées et des caténaires
  • Usines et production industrielle : Siemens et les chaînes de production intelligentes, IA, IoT
  • Énergie et Réseaux Électriques : EDF et la maintenance prédictive des centrales

Airbus - Skywise Core [X]

Identifier à l'avance les composants susceptibles de tomber en panne

  • IA analyse les données des capteurs des avions en temps réel : température moteur, vibrations, pression hydraulique, usure des pièces, etc.
  • détecte les anomalies avant qu'une panne ne survienne
  • réduction des coûts d’exploitation : éviter les réparations d'urgence, qui coûtent très cher
  • partage de données : comparer les performances, bénéficier de l'expérience des autres
  • Big Data & IoT, IA & Machine Learning

Siemens

Acteur majeur de l'Industrie 4.0

  • Siemens MindSphere / Insights Hub : connecter les machines, capteurs et systèmes pour collecter et analyser des données en temps réel.
  • algorithmes d'IA pour optimiser la maintenance prédictive, améliorer la qualité, réduire les coûts
  • SIMATIC et TIA Portal : faciliter la programmation intelligente et l'automatisation des processus industriels
  • Exemple MGI : production réelles collectées en atelier, jumeau numérique, comprendre la cause profonde d'un problème, augmentation du rendement de 15 %

Mise en oeuvre


Comment mettre en oeuvre l'analyse des données pour détecter et prévenir ?


IA et apprentissage

Qu'est-ce que l'IA

Selon le point de vue on peut donner différentes définitions de l'IA

  • rendre les machines intelligentes (car pas de volonté, pas de conscience, d'émotions)
  • faire faire aux machines ce que nous savons faire
  • incorporer une partie de l'intelligence humaine dans les algorithmes
  • utiliser les machines afin de résoudre des problèmes complexes que l'on sait résoudre mais que l'on ne peut résoudre car trop volumineux

Les domaines de l'IA

  • raisonnement : logique, démonstration automatique, graphes, ...
  • compréhension de notre environnement : analyse d'image, vision artificielle
  • compréhension du langage : LLM (ChatGPT, CoPilot, Gemini, ...)
  • résolution de problèmes complexes : force brute $\rightarrow$ optimisation combinatoire (métaheuristques), RO
  • apprentissage : extraire de l'information des données

Ordinateur et données

l'ordinateur est capable de traiter de grandes quantités de données

  • calculs simples : tri, moyenne, ...
  • optimisation : circuits vectoriels, parallélisme
  • comment l'utiliser pour extraire de l'information à valeur ajoutée ?
    • Exemple supermarché
    • comment organiser les rayons pain, fromage, beurre, vin ?
    • centralisation ou dispersion ?

L'apprentissage nous permet de créer des modèles prédictifs à partir de données

Vocabulaire

IA, ML et DL

la data : exploiter des données

BI : Business Intelligence

FrançaisAnglais
fouille de données data-mining
apprentissage (machine, automatique, artificiel) machine learning
apprentissage profond deep-learning
mégadonnées ou données massives big data

définition de l'Apprentissage 1/3


consiste à laisser des algorithmes découvrir des motifs récurrents dans les ensembles de données

  • à laisser : c'est magique ?
  • consiste à créer
  • découvrir : capable par un calcul de trouver des motifs dans les données (corrélations)

définition de l'Apprentissage 2/3

se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'apprendre à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune (Wikipedia)

  • apprendre : calculer
  • performance : capacité
  • explicitement : c'est le cas de tous les algorithmes

Apprentissage 3/3


une branche de l'IA qui utilise des approches mathématiques et statistiques pour exhiber des modèles / relations à partir de données.


Ces modèles peuvent ensuite être utilisés pour faire des prédictions et aider à prendre des décisions (avec ou sans intervention humaine )

Sans intervention humaine

anscombe

1973 Francis Anscombe, attention aux données aberrantes (outlier)

Le principe de l'apprentissage

  • étant donnée une matrice $X(n,p)$ de $n$ individus dotés de $p$ propriétés
  • prédire une matrice $Y(n,k)$, telle que :
$$ Y = f(X) + \epsilon $$
  • difficulté : quelle méthode choisir pour trouver $f$ ?
  • importance du niveau de bruit $\epsilon$
  • minimiser l'erreur $∑ (Y-f(X))^2$

Le principe de l'apprentissage

$Y_1 = 3 x_1 + 2 {x_2}^2 - 3x_3 + x_4$, $Y_2 =$ ?

machine learning principle

Niveau de Bruit

Cas d'une régression linéaire $y = 1.5 x + 3$

Bruitage faible Bruitage fort

Peut (ou peut ne pas) avoir du sens

Régression linéaires et bruit

dans ce cas elle a du sens : catégories

Régressions linéaires

Les types d'apprentissages


  • supervisé : on connaît $X$ et $Y$, on cherche $f$

  • semi-supervisé : on connaît $X$ et une partie de $Y$, on cherche $Y$ et $f$

  • non supervisé : on connaît $X$ mais pas $Y$, on cherche $Y$ et $f$

  • par renforcement : récompense, amélioration

Apprentissage Supervisé

Méthodes de Machine Learning

Méthodes

Méthodes de Machine Learning

SVM

Support Vector Machine

  • Algorithme d'apprentissage supervisé
  • séparateur à large marge
  • trouve l'hyperplan qui maximise la distance entre les classes
  • Utilisé pour la classification et la régression

SVM

Choix du kernel

  • linéaire
  • polynomial
  • (Gaussian) Radial Basis Function (RBF)
  • Sigmoïd
  • Custom
  • ...

Arbres de décision

Iris Decision Tree

Source Cédric (CNAM)

  • critère qui divise le mieux les données (entropie ou in indice Gini $1 - ∑ p_k^2$)
  • diminuer l'impureté des classes (Gini)
  • Facile à comprendre et à expliquer
  • données numériques ou catégorielles
  • Corrado Gini (1884-1965) statisticien italien

L'apprentissage profond

  • une branche de l'apprentissage
  • pour des données non structurées (image, son, texte)
  • basé sur les réseaux de neurones
  • classification (valide / non valide) ou prédiction
  • un OCNI : une super fonction à $e$ entrées et $s$ sorties
  • quand $f$ n'est pas exprimable sous forme d'un algorithme
  • nécessite beaucoup de données
  • apprentissage long (propagation et back-propagation)

Les Réseaux de Neurones

Type de réseauType de donnéesPropriétésExemples
Perceptron Multicouche (MLP, ANN)Données tabulaires (chiffres, vecteurs)Basique, dense, couches entièrement connectéesCrédit, santé, maintenance prédictive
Réseaux Convolutifs (CNN)Images, vidéos, signaux 2D/3DCapte les motifs spatiaux (bords, textures, formes)Vision par ordinateur, diagnostic visuel
Réseaux Récurrents (RNN)Séries temporelles, texte, audioPrend en compte l’ordre et la dépendance dans le tempsPrédictions météo, analyse de texte
Réseaux de Neurones Génératifs (GNN)Données non étiquetéesGénération de nouvelles donnéesCréation d'images, musique

GNN et matériaux

Application dans les matériaux

  • synthétiser des microstructures de matériaux réalistes pour les simulations numériques
  • prédire les propriétés mécaniques des matériaux à partir de leurs microstructures
  • générer des images de microstructures de matériaux à partir de données expérimentales
  • ...

Architectures des RN

Exemple

Cliquer sur curseur bas pour faire défiler les transparents

Apprentissage

Exemple des Iris de Fisher

  • données : longueur et largeur des sépales et pétales pour trois espèces (setosa, versicolor, virginica)
  • comment reconnaître / identifier une espèce ?

Données des Iris

"sepal.length","sepal.width","petal.length","petal.width","variety"
    5.1, 3.5, 1.4,. 2, "Setosa"
    4.9, 3.0, 1.4, .2, "Setosa"
    ...

IRIS - Pair plot

IRIS - Longueur et largeur des pétales

IRIS - Réseau de neurones


I0000 00:00 StreamExecutor device (0): NVIDIA GeForce RTX 3050, Compute Capability 8.6
I0000 00:00 65852 cuda_dnn.cc:529] Loaded cuDNN version 90701

Temps d'exécution : 10.46 secondes pour 350 epochs

5/5 ━━━━━━━━━━━━━━━━━━━━ 1s 52ms/step
Accuracy NN: 0.99
Confusion Matrix NN:
 [[50  0  0]
  [ 0 49  1] ← mauvaise prédiction
  [ 0  0 50]]
Classification Report NN:
               precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        50
  versicolor       1.00      0.98      0.99        50
   virginica       0.98      1.00      0.99        50

    accuracy                           0.99       150
   macro avg       0.99      0.99      0.99       150
weighted avg       0.99      0.99      0.99       150   

IRIS - Réseau de neurones

classement iris réseau de neurones

IRIS - Réseau de neurones

loss function evolution

Défauts des méthodes

  • sur-apprentissage (overfitting) :
    • bonne prédiction sur les données d'apprentissage
    • mauvaise prédiction sur les données de test
  • sous-apprentissage (underfitting) :
    • le modèle est trop simple pour capturer les tendances des données
  • biais des données (data bias) :
    • les données d'apprentissage ne sont pas représentatives de la réalité
    • exemple : biais de genre, racial, ...

Conclusion

Résumé


Matériaux : enjeux économiques et sécuritaires colossaux

prévention, prédiction des pannes, des risques, des catastrophes

simulation pour amélioration

IA et Machine Learning : outils puissants pour l'Industrie 4.0

précision des données (ex: maisons, appartements, ancienneté, taille du terrain, ...)

choix de la méthode d'apprentissage : explicabilité

combinaison de méthodes d'apprentissage ?

Merci pour votre attention

Liens