Des élèves d’IFP School formé(e)s au Machine Learning

De nombreux secteurs sont aujourd’hui bouleversés par le numérique, et les géosciences ne font pas exception. Le "Machine Learning", littéralement la "machine apprenante", est l’une des sous-catégories de l’intelligence artificielle largement utilisée pour résoudre les défis les plus complexes d’exploration et d’exploitation des géoressources.

Une trentaine d’élèves des programmes Petroleum Geosciences (PGS) et Reservoir Geoscience and Engineering (RGE) d’IFP School se sont initié(e)s aux méthodes du Machine Learning dans le cadre d’une nouvelle unité d’enseignement obligatoire "Machine Learning and Data Analytics", conçue par Frédérique Fournier, Directrice du centre Géoressources et énergie, et Karine Labat, Responsable du programme Petroleum Data Management.

"L'objectif de ce cours est de faire découvrir aux élèves les techniques d'apprentissage automatique, où les algorithmes apprennent à partir des données. Ces techniques permettent l’exploration des données et ajoutent également de la valeur aux données, à partir de leur analyse ou encore en réalisant des prédictions" explique Karine Labat.

"Ce sont des techniques novatrices qui sont désormais appliquées partout, en complément des méthodes conventionnelles. Dans certains cas, elles peuvent même remplacer ces dernières ! Ce sont des méthodes de classification, de clustering (regroupement) et de régression" ajoute-t-elle.

L’unité d’enseignement a démarré début 2022 avec une série de cours magistraux dispensés par des chercheurs de la direction Sciences et Technologies du numérique d’IFP Energies nouvelles et Yani Meziane, diplômé du programme Petroleum Geosciences (promotion 2019).

Les domaines d’application du Machine Learning étant nombreux, 35 élèves des centres Procédés pour l’énergie et la chimie et Motorisations et mobilité durable ont également suivi les cours magistraux aux côtés des classes de PGS et RGE. L’équipe pédagogique souhaitait ainsi tester la nouvelle unité d’enseignement pour évaluer son éventuelle intégration dans les autres programmes de formation.

Les élèves ont ensuite été réparti(e)s en binôme pour travailler sur des mini-projets basés sur des données réelles.

"Pour les élèves de PGS et de RGE, ce fut l’occasion de s'exercer sur des jeux de données réelles dans les domaines des géosciences et de l’ingénierie de réservoir, et de résoudre des problèmes typiques" précise Karine Labat.

"L’objectif est que nos élèves soient agiles avec les données et deviennent opérationnel(-le)s sur ces sujets de Machine Learning" poursuit-elle.

Pour cela, pendant deux mois, les groupes ont travaillé sur des applications de Machine Learning pour résoudre des problématiques d’estimation de propriété réservoir, d’interprétation sismique ou encore d’optimisation de la production des géoressources. Encadré(e)s par des coachs, les élèves ont bénéficié de l’expertise de professionnels de Beicip-Franlab, d’ingénieurs d’IFP Energies nouvelles, d’enseignants d’IFP School et de deux jeunes diplômé(e)s du programme PGS de la promotion 2021, Imoleayo Fashagba et Maria Betania Cedeño Tepedino.

Les élèves devaient restituer leur travail sous la forme d’un poster et ensuite le présenter soit via un podcast de 5 minutes ou un pitch de même durée devant un jury composé de professionnels.

Ayant déjà une expérience avec la solution MATLAB, Elias Macuacua (Mozambique) et Aymeric Astoux (France), tous deux élèves du programme Petroleum Geosciences, ont appris à coder tout seuls en langage Python. Ils sont très satisfaits du cours et en parlent avec enthousiasme :

"J’ai beaucoup apprécié d’avoir l’opportunité d’acquérir des compétences qui sont de plus en plus plébiscitées dans les géosciences. Les entreprises de ce secteur recherchent des personnes ayant un bagage minimum en programmation et en Machine Learning" note Elias.

"Nous avons amélioré nos connaissances et nos compétences en analyse de données et en programmation, notamment en Python" renchérit Aymeric.

"Nous sommes désormais capables d’analyser et de faire des déductions significatives à partir d’un ensemble de données" ajoute-t-il.

Elias et Aymeric se sont challengés en choisissant un sujet plutôt orienté ingénierie de réservoir. Ils ont travaillé sur la maintenance prédictive en appliquant des techniques de clustering.

Encadrés par Baptiste Auffray, ingénieur réservoir chez Beicip-Franlab, ils ont appliqué et testé des algorithmes pour anticiper l’apparition de pannes sur des électropompes submersibles (ESP), utilisées sur deux champs pétroliers afin d’aider la production de fluides du sous-sol.

Illustration 2 Machine Learning
En utilisant la méthode de clustering, Elias et Aymeric ont analysé la pression de décharge d’un des deux puits. Sur l’image de gauche se trouvent les données brutes, où l’on aperçoit une valeur élevée qui écrase le reste des données. Dans le cadre d’un contrôle de qualité, Elias et Aymeric ont ensuite nettoyé les données pour supprimer la valeur altérant l’ensemble. À l’aide d’un algorithme différent, ils ont remplacé cette valeur pour obtenir une courbe de pression correcte (figure de droite).

"Nous avons analysé diverses variables liées au fonctionnement des pompes telles que l’intensité du moteur, sa fréquence, la pression" explique Elias.

"Nous avons cherché à anticiper les anomalies pour ainsi réduire considérablement les coûts de maintenance" poursuit Aymeric.

Ademola Adelakun, élève nigérian du programme Reservoir Geoscience and Engineering, et Maria Hinojosa Chacin (Venezuela) ont choisi un sujet de géosciences, domaine dont ils ne sont pas spécialistes.

Coachés par Maria Betania Cedeño Tepedino, diplômée du programme PGS, ils ont travaillé sur des données provenant du champ Volve d’Equinor. Leur projet portait sur l’estimation de propriétés de réservoir, à partir de données de puits, par des méthodes de régression en utilisant des réseaux de neurones.

"La perspective d'utiliser une fonction de régression pour prédire des propriétés très importantes de la roche était très séduisante pour moi" souligne Ademola.

"En appliquant certains modèles de régression, nous avons cherché à prédire simultanément le volume, la porosité et la saturation en eau des grès à partir de diagraphies conventionnelles : gamma-ray, densité apparente, porosité neutronique, résistivité et sonique" explique-t-il.

"J’ai aimé résoudre un problème pratique en codant sur Python et acquérir des compétences en matière de visualisation de données. J’ai désormais une meilleure compréhension de l’apprentissage supervisé ("Supervised Learning" en anglais) !" ajoute-t-il avec fierté.

Dossier rédigé par Meyling SIU