IA et Sciences des Matériaux : le rôle du Machine Learning
Jean-Michel Richer (JMR70)
EC Informatique - LERIA - Université d'Angers
Mardi 6 Mai 2025, Conférence Plénière
Polytech, Angers
Plan
- Importance de l'IA pour les matériaux
- Industrie 4.0
- Exemples d'applications
- IA et Apprentissage
- Intelligence Artificielle
- Apprentissage Automatique
- Apprentissage Supervisé, non supervisé, etc
Les matériaux
Enjeux économiques et sécuritaires colossaux
- construction des matériaux : optimisation des procédés de fabrication (méthodes, alliages)
- matériaux composites : polymères, céramiques, métaux, nanomatériaux, biomatériaux
- propriétés mécaniques : durabilité, résistance, fatigue, corrosion, vieillissement
- propriétés thermiques, électriques, magnétiques, acoustiques
- prévention des risques (suivi dans le temps):
- détection des défauts : viellissement, fissures, corrosion, etc
- détection des pannes : prévention des accidents
- prédiction des pannes : réduction des coûts de maintenance (arrêt, maintenance, remise en route)
L'IA et le Machine Learning sont des outils puissants pour répondre à ces enjeux
Un Exemple
- environ $200 000$ à $250 000$ ponts en France
- rapport sénatorial (2019) :
en 2022, $30000$ à $35000$ ouvrages en mauvais état structurel
- comment faire pour assurer le suivi ?
- Exemple A review of metallic bridge failure statistics,
University of Surrey, UK, ABMAS 2010 :
- étude statistique sur 164 ponts dont 87 (51 %) ont connu un effondrement total
- la fatigue est apparue comme le mode de défaillance le plus fréquent dans les cas de ponts métalliques endommagés mais non effondrés
Industrie 4.0
Source Visiativ.com
Industrie 4.0
- l'OT produit les données en temps réel
- l'IT les traite et les exploite pour améliorer la performance
- OT (Operational Technology) : systèmes de contrôle industriel, capteurs, actionneurs
- IT (Information Technology) : systèmes d’information, gestion des données
- Cloud : stockage et traitement des données à distance
- Edge Computing : traitement des données à la source (proximité des capteurs)
- IoT (Internet of Things) : objets connectés, capteurs intelligents
- AI (Artificial Intelligence) : algorithmes d’apprentissage automatique, traitement des données
- Big Data : traitement de grandes quantités de données
Exemple
Prédire des propriétés mécaniques à partir d’images (ténacité à la rupture $K_{IC}$)
- images de microscopie électronique à balayage
- nettoyage des images, segmentation pour isoler les grains
- extraction des caractéristiques : réseau de neurones (CNN)
- modélisation : régression linéaire, SVM, forêts aléatoires
permettre de gagner du temps et réduire les coûts d’essais destructifs en laboratoire
Fiabilité
- modèles prédictifs (en prévention) pour la dégradation des matériaux (vieillissement ou corrosion): données historiques, régression, RN
- maintenance prédictive (en temps réel) afin d'éviter les pannes : exploitation des données de capteurs machine learning pour déterminer les signes précurseurs de
défaillance (SVM, arbres des décision)
- contrôle non destructifs (CND) : imagerie ultrasons, rayons X -> vision, RN pour la détection de fissures
- jumeaux numériques (Digital Twins) : pour la simulation et la gestion du cycle de vie
- optimisation de la conception des structures avec des algorithmes génétiques : explorer des centaines de combinaisons de matériaux, de formes
Jumeau numérique Angers
Une modélisation 3D du territoire à la fois référentiel de données et outil d’aide à la décision
- Connaissance du territoire
- Simulation à des fins d’aide à la prise de décision ou d’aide au pilotage des politiques publiques
- Communication et sensibilisation
Application : inondations, aménagement des quartiers, structure/résistance des ponts
Jumeau numérique Angers
Maintenance Prédictive
Applications
- Automobile : Tesla, détection des anomalies (batterie, freins, moteur électrique), une mise à jour logicielle à distance
- Aéronautique : Airbus, projet Skywise
- Industrie Pétrolière et Gazière : Shell surveillance des pipelines
- Ferroviaire : SNCF et l’analyse des voies ferrées et des caténaires
- Usines et production industrielle : Siemens et les chaînes de production intelligentes, IA, IoT
- Énergie et Réseaux Électriques : EDF et la maintenance prédictive des centrales
Airbus - Skywise Core [X]
Identifier à l'avance les composants susceptibles de tomber en panne
- IA analyse les données des capteurs des avions en temps réel : température moteur, vibrations, pression hydraulique, usure des pièces, etc.
- détecte les anomalies avant qu'une panne ne survienne
- réduction des coûts d’exploitation : éviter les réparations d'urgence, qui coûtent très cher
- partage de données : comparer les performances, bénéficier de l'expérience des autres
- Big Data & IoT, IA & Machine Learning
Siemens
Acteur majeur de l'Industrie 4.0
- Siemens MindSphere / Insights Hub : connecter les machines, capteurs et systèmes pour collecter et analyser des données en temps réel.
- algorithmes d'IA pour optimiser la maintenance prédictive, améliorer la qualité, réduire les coûts
- SIMATIC et TIA Portal : faciliter la programmation intelligente et l'automatisation des processus industriels
- Exemple MGI :
production réelles collectées en atelier, jumeau numérique, comprendre la cause profonde d'un problème, augmentation du rendement de 15 %
Mise en oeuvre
Comment mettre en oeuvre l'analyse des données pour détecter et prévenir ?
Qu'est-ce que l'IA
Selon le point de vue on peut donner différentes définitions de l'IA
- rendre les machines intelligentes (car pas de volonté, pas de conscience, d'émotions)
- faire faire aux machines ce que nous savons faire
- incorporer une partie de l'intelligence humaine dans les algorithmes
- utiliser les machines afin de résoudre des problèmes complexes que l'on sait résoudre mais que l'on ne peut
résoudre car trop volumineux
Les domaines de l'IA
- raisonnement : logique, démonstration automatique, graphes, ...
- compréhension de notre environnement : analyse d'image, vision artificielle
- compréhension du langage : LLM (ChatGPT, CoPilot, Gemini, ...)
- résolution de problèmes complexes : force brute $\rightarrow$ optimisation combinatoire (métaheuristques), RO
- apprentissage : extraire de l'information des données
Ordinateur et données
l'ordinateur est capable de traiter de grandes quantités de données
- calculs simples : tri, moyenne, ...
- optimisation : circuits vectoriels, parallélisme
- comment l'utiliser pour extraire de l'information à valeur ajoutée ?
- Exemple supermarché
- comment organiser les rayons pain, fromage, beurre, vin ?
- centralisation ou dispersion ?
L'apprentissage nous permet de créer des modèles prédictifs à partir de données
Vocabulaire
la data : exploiter des données
BI : Business Intelligence
Français | Anglais |
fouille de données |
data-mining |
apprentissage (machine, automatique, artificiel) |
machine learning |
apprentissage profond |
deep-learning |
mégadonnées ou données massives |
big data |
définition de l'Apprentissage 1/3
consiste à laisser des algorithmes découvrir des motifs récurrents dans les ensembles de données
- à laisser : c'est magique ?
- consiste à créer
- découvrir : capable par un calcul de trouver des motifs dans les données (corrélations)
définition de l'Apprentissage 2/3
se fonde sur des approches mathématiques et statistiques pour donner aux
ordinateurs la capacité d'apprendre à partir de données, c'est-à-dire d'améliorer leurs performances
à résoudre des tâches sans être explicitement programmés pour chacune
(Wikipedia)
- apprendre : calculer
- performance : capacité
- explicitement : c'est le cas de tous les algorithmes
Apprentissage 3/3
une branche de l'IA qui utilise des approches mathématiques et statistiques
pour exhiber des modèles / relations à partir de données.
Ces modèles peuvent ensuite être utilisés pour faire des prédictions et aider à prendre des décisions
(avec ou sans intervention humaine )
Sans intervention humaine
1973 Francis Anscombe, attention aux données aberrantes (outlier)
Le principe de l'apprentissage
- étant donnée une matrice $X(n,p)$ de $n$ individus dotés de $p$ propriétés
- prédire une matrice $Y(n,k)$, telle que :
$$
Y = f(X) + \epsilon
$$
- difficulté : quelle méthode choisir pour trouver $f$ ?
- importance du niveau de bruit $\epsilon$
- minimiser l'erreur $∑ (Y-f(X))^2$
Le principe de l'apprentissage
$Y_1 = 3 x_1 + 2 {x_2}^2 - 3x_3 + x_4$, $Y_2 =$ ?
Niveau de Bruit
Cas d'une régression linéaire $y = 1.5 x + 3$

Peut (ou peut ne pas) avoir du sens
Régression linéaires et bruit
dans ce cas elle a du sens : catégories
Les types d'apprentissages
- supervisé : on connaît $X$ et $Y$, on cherche $f$
- semi-supervisé : on connaît $X$ et une partie de $Y$, on cherche $Y$ et $f$
- non supervisé : on connaît $X$ mais pas $Y$, on cherche $Y$ et $f$
- par renforcement : récompense, amélioration
Apprentissage Supervisé
Méthodes
SVM
Support Vector Machine
- Algorithme d'apprentissage supervisé
- séparateur à large marge
- trouve l'hyperplan qui maximise la distance entre les classes
- Utilisé pour la classification et la régression
SVM
Choix du kernel
- linéaire
- polynomial
- (Gaussian) Radial Basis Function (RBF)
- Sigmoïd
- Custom
- ...
Arbres de décision
- critère qui divise le mieux les données (entropie ou in indice Gini $1 - ∑ p_k^2$)
- diminuer l'impureté des classes (Gini)
- Facile à comprendre et à expliquer
- données numériques ou catégorielles
- Corrado Gini (1884-1965) statisticien italien
L'apprentissage profond
- une branche de l'apprentissage
- pour des données non structurées (image, son, texte)
- basé sur les réseaux de neurones
- classification (valide / non valide) ou prédiction
- un OCNI : une super fonction à $e$ entrées et $s$ sorties
- quand $f$ n'est pas exprimable sous forme d'un algorithme
- nécessite beaucoup de données
- apprentissage long (propagation et back-propagation)
Les Réseaux de Neurones
Type de réseau | Type de données | Propriétés | Exemples |
Perceptron Multicouche (MLP, ANN) | Données tabulaires (chiffres, vecteurs) | Basique, dense, couches entièrement connectées | Crédit, santé, maintenance prédictive |
Réseaux Convolutifs (CNN) | Images, vidéos, signaux 2D/3D | Capte les motifs spatiaux (bords, textures, formes) | Vision par ordinateur, diagnostic visuel |
Réseaux Récurrents (RNN) | Séries temporelles, texte, audio | Prend en compte l’ordre et la dépendance dans le temps | Prédictions météo, analyse de texte |
Réseaux de Neurones Génératifs (GNN) | Données non étiquetées | Génération de nouvelles données | Création d'images, musique |
GNN et matériaux
Application dans les matériaux
- synthétiser des microstructures de matériaux réalistes pour les simulations numériques
- prédire les propriétés mécaniques des matériaux à partir de leurs microstructures
- générer des images de microstructures de matériaux à partir de données expérimentales
- ...
Exemple
Cliquer sur curseur bas ↓ pour faire défiler les transparents
Apprentissage
Exemple des Iris de Fisher
- données : longueur et largeur des sépales et pétales pour
trois espèces (setosa, versicolor, virginica)
- comment reconnaître / identifier une espèce ?
Données des Iris
"sepal.length","sepal.width","petal.length","petal.width","variety"
5.1, 3.5, 1.4,. 2, "Setosa"
4.9, 3.0, 1.4, .2, "Setosa"
...
IRIS - Pair plot
IRIS - Longueur et largeur des pétales
IRIS - Réseau de neurones
I0000 00:00 StreamExecutor device (0): NVIDIA GeForce RTX 3050, Compute Capability 8.6
I0000 00:00 65852 cuda_dnn.cc:529] Loaded cuDNN version 90701
Temps d'exécution : 10.46 secondes pour 350 epochs
5/5 ━━━━━━━━━━━━━━━━━━━━ 1s 52ms/step
Accuracy NN: 0.99
Confusion Matrix NN:
[[50 0 0]
[ 0 49 1] ← mauvaise prédiction
[ 0 0 50]]
Classification Report NN:
precision recall f1-score support
setosa 1.00 1.00 1.00 50
versicolor 1.00 0.98 0.99 50
virginica 0.98 1.00 0.99 50
accuracy 0.99 150
macro avg 0.99 0.99 0.99 150
weighted avg 0.99 0.99 0.99 150
IRIS - Réseau de neurones
IRIS - Réseau de neurones
Défauts des méthodes
- sur-apprentissage (overfitting) :
- bonne prédiction sur les données d'apprentissage
- mauvaise prédiction sur les données de test
- sous-apprentissage (underfitting) :
- le modèle est trop simple pour capturer les tendances des données
- biais des données (data bias) :
- les données d'apprentissage ne sont pas représentatives de la réalité
- exemple : biais de genre, racial, ...
Résumé
Matériaux : enjeux économiques et sécuritaires colossaux
prévention, prédiction des pannes, des risques, des catastrophes
simulation pour amélioration
IA et Machine Learning : outils puissants pour l'Industrie 4.0
précision des données (ex: maisons, appartements, ancienneté, taille du terrain, ...)
choix de la méthode d'apprentissage : explicabilité
combinaison de méthodes d'apprentissage ?
Merci pour votre attention