Machine Learning in Prospectivity Analysis

L’apprentissage automatique dans l’analyse de prospectivité  des ressources minérales 

Au nom de BHP, SRK Consulting et DeepIQ se sont associés dans une initiative visant à adapter une approche combinée pour améliorer la modélisation de la prospection. En combinant des techniques avancées de traitement de données, en capitalisant sur les connaissances existantes, en intégrant l'interprétation géologique et en s'appuyant sur l'apprentissage automatique (ML), l'équipe a exploré différentes méthodes pour faciliter la découverte de vastes gisements de cuivre porphyrique dans une région déjà bien prospectée dans le nord des Andes chiliennes. 

L'étude a utilisé une approche de système minéral pour traiter les données disponibles. Sur la base des connaissances géologiques mondiales et locales, les principaux vecteurs d'exploration et les critères spécifiques aux gisements de cuivre porphyriques ont été répertoriés et compilés sur la zone d'intérêt. Toutes les informations pertinentes ont été extraites des ensembles de données régionaux disponibles à l'aide d'un large éventail de méthodes et d'algorithmes d'interprétation et de traitement. Lorsque les ensembles de données régionaux étaient jugés insuffisamment probants, ils ont été retraités pour s'assurer qu'ils pouvaient être absorbés par l’apprentissage automatique. Ces informations ont été transformées en couches de données probantes, puis intégrées à d'autres ensembles de données multimodales dans une plateforme de données en nuage. Le résultat est un ensemble de données complet et structuré, prêt à être analysé. Ces données ont été analysées en combinant des algorithmes exploitant les connaissances et des algorithmes avancés d'apprentissage automatique et d'apprentissage profond. Les forces et les faiblesses de chaque approche ont été intégrées dans un processus d'amélioration continue, permettant d'affiner progressivement les modèles.  

Les avantages de la combinaison des connaissances géologiques avec le ML résident dans le fait que l’apprentissage automatique promet une approche plus objective, la minimisation des biais humains et l'interrogation rapide de grandes quantités de données. Cependant, l’apprentissage automatique peut être sujet à des biais (par exemple, les données utilisées et/ou la relation entre les données et les processus géologiques et/ou les caractéristiques d'intérêt). Une sélection erronée des données, des données de mauvaise qualité ou un lien peu évident ou compliqué entre les données et l'élément géologique ou le gisement d'intérêt sont autant de facteurs qui peuvent conduire à de mauvais résultats. Une combinaison équilibrée de géosciences et de science des données peut aider à minimiser ces biais et à obtenir de meilleurs résultats. 

Les résultats de l'analyse des données nécessaires pour identifier les emplacements connus des gisements de cuivre porphyrique avec un niveau élevé de précision ont constitué la première étape de la démonstration d'une approche crédible et potentiellement solide de la prospection. 

Des centaines d'ensembles de données individuels ont été générés au cours de l'étude, en plus de ceux fournis à l'origine à l'équipe de l'étude. La manière dont les ensembles de données sont corrélés au modèle du système minéral a toujours été prise en compte dans le processus de boucle de rétroaction entre les géoscientifiques et les scientifiques des données lorsqu'il s'agit de décider quels ensembles de données utiliser dans les modèles de potentiel minéral. Ce processus de rétroaction a permis d'améliorer la compréhension des résultats du modèle et d'affiner par la suite les prédictions. 

Les ensembles de données géologiques incluaient l'interprétation de la géologie solide, la réinterprétation structurale, l'analyse des données géochimiques, la présence de minéraux/gisements (y compris la redéfinition des empreintes), et les modèles d'altération en 2D. Les ensembles de données géophysiques et de télédétection comprenaient le magnétisme, l'électromagnétisme, la gravité, la radiométrie mineure, les modèles numériques de terrain et l'imagerie satellitaire (ASTER, Sentinel 2). 

Les données d'entrée éparses et non uniformes, comme les données géochimiques, étaient généralement utilisées comme éléments de confirmation plutôt que comme éléments obligatoires dans les modèles de potentiel minéral, réduisant ainsi la nécessité d'imputer les données manquantes (l'imputation est un procédé qui consiste à remplacer les valeurs manquantes dans un jeu de données par des valeurs estimées). 

Un modèle lithostructural 3D de la zone d'intérêt a également été généré en mettant l'accent sur le développement du cadre structurel et intrusif en fournissant un cadre structurel et géologique 3D de la zone d'intérêt pour aider à mieux comprendre l'architecture de la région et évaluer les contrôles sous-jacents du dépôt de cuivre porphyrique en 3D – et pour fournir une extension du cadre de ciblage 2D en 3D pour tester l'applicabilité du ciblage 3D à l'échelle régionale. 

Un vaste ensemble de données d'entrée et un réseau d'inférence ont été utilisés pour générer les modèles de potentiel minéral finaux à travers plusieurs itérations à l'aide de flux de travail de logique floue bien éprouvées et d'analyses de données avancées. Les résultats de l'analyse des données nécessaires pour identifier les emplacements connus des gisements de cuivre porphyrique avec un haut niveau de précision constituent la première étape de la démonstration d'une approche crédible et potentiellement fiable de l'exploration. 

Le potentiel minéral basé a été estimé en 2D et 3D à l'aide de plateforme de calcul de cloud distribuées et évolutives, en s'appuyant sur l'apprentissage automatique. Les meilleurs résultats ont été fusionnés avec les résultats de la logique floue basés sur les connaissances géologiques en utilisant une approche de fusion pour délimiter les zones d'intérêt. 

Les principaux résultats comprenaient : 

Certaines couches de preuve clés ont été les principaux facteurs. 

La plupart d'entre elles résultent de l'amélioration et de la réinterprétation des ensembles de données géologiques, y compris la création de nouveaux ensembles. 

Plusieurs des nouvelles cartes ont également été des outils importants dans le processus d'examen et d'analyse itérative (y compris l'évaluation des spécialistes). 

Les couches d'intrusion (près de la surface et en profondeur) et les structures majeures étaient des couches probantes importantes dans les modèles de potentiel minéral finaux issus à la fois des connaissances géologiques et de la modélisation basée sur l’apprentissage automatique. 

La cartographie des altérations magnétiques a été notée comme un facteur supplémentaire dans la modélisation basée sur l’apprentissage automatique. 

Conclusions : 

  • Une approche productive et collaborative a permis un enrichissement réciproque des idées sans qu'aucun spécialiste ou équipe de spécialistes ne soit à l'origine des résultats. Une application fine de l'analyse des données dans un contexte de système minéral est idéale pour les projets d’exploitation régionale. 
  • Des ensembles de données améliorés et nouveaux, basés sur les connaissances géologiques, ont été très importants pour obtenir les résultats de cette étude. 
  • L'introduction d'un modèle de fusion basé sur l’apprentissage automatique a joué un rôle déterminant dans la production de modèles de potentiel minéral optimaux. La fusion est une méthode efficace pour combiner une série de modèles complémentaires, notamment des modèles à base de connaissances qui intègrent l'expertise humaine, et des modèles d'apprentissage profond qui exploitent les données. 
  • Les entrées de données éparses et non uniformes peuvent être utilisées comme éléments de données de confirmation plutôt que comme éléments de données obligatoires. La synthèse d'entrées de données éparses en indicateurs géologiques est une stratégie efficace dans des environnements où les données disponibles sont limitées. 
  • Plusieurs zones à haut potentiel minéral ont été identifiées pour un examen plus approfondi dans une région bien explorée.