Machine Learning in Prospectivity Analysis

Aprendizaje automático en análisis de prospectividad 

En nombre de BHP, SRK Consulting y DeepIQ se han asociado en una iniciativa para adaptar un enfoque combinado para mejorar el modelado de prospectividad. Al combinar  procesamiento avanzado de datos, compilación de  conocimientos, interpretación geológica y aprendizaje automático (ML), el equipo investigó múltiples enfoques para apoyar  el descubrimiento de grandes depósitos de pórfido de cobre en una región bien explorada en los Andes del norte de Chile. 

El estudio utilizó un enfoque de sistema mineral para abordar los datos disponibles. Basándose  en el conocimiento geológico global y local, se tabularon los principales vectores y criterios de exploración de depósitos de pórfidos de cobre en el área de interés. Se extrajo toda la información valiosa  de los conjuntos de datos regionales disponibles utilizando una amplia gama de métodos y algoritmos de interpretación y procesamiento. Cuando se consideró que los conjuntos de datos regionales carecían de suficiente  solidez , se reelaboraron para garantizar que fueran adecuados  para su incorporación en un flujo de trabajo basado en ML. Esta información se tradujo en capas de evidencia  y los conjuntos de datos multimodales se incorporaron a una plataforma de datos en la nube e integraron para formar un conjunto de datos listo para análisis. Estos datos se analizaron utilizando una combinación de algoritmos basados en el conocimiento y algoritmos avanzados de ML y aprendizaje profundo, incorporando  diversas fortalezas y debilidades  de cada enfoque en un bucle  de retroalimentación iterativo. 

Los beneficios de combinar el conocimiento geológico con el aprendizaje automático (ML) incluyen que el ML promete un enfoque más objetivo, la minimización del sesgo humano y la rápida interrogación  de grandes cantidades de datos. Sin embargo, el ML puede estar sujeto a sesgos (por ejemplo, los datos utilizados y/o la relación entre los datos y los procesos geológicos y/o características de interés). La selección inadecuada de datos, datos de mala calidad o un vínculo tenue o complicado entre los datos y la característica geológica o el depósito de interés pueden conducir a resultados deficientes. Una combinación matizada de geociencia y ciencia de datos puede ayudar a minimizar estos sesgos y conducir a mejores resultados. 

Los resultados del análisis de datos necesarios para identificar ubicaciones conocidas de depósitos de pórfido de cobre con un alto nivel de precisión fueron el primer paso para demostrar un enfoque  creíble y potencialmente robusto para la exploración. 

Durante el estudio se generaron cientos de conjuntos de datos individuales, además de los proporcionados originalmente al equipo de estudio. La forma en que los conjuntos de datos se relacionaban con el modelo del sistema mineral siempre se tuvo en cuenta en el proceso de retroalimentación entre los geocientíficos y los científicos de datos al decidir qué conjuntos de datos usar en los modelos de potencial mineral. Este proceso de retroalimentación mejoró la comprensión de los resultados del modelo y el posterior refinamiento de los  resultados. 

Los conjuntos de datos geológicos incluyeron  interpretación de  geología sólida,  reinterpretación de  estructuras, análisis de  datos geoquímicos,  presencia  de minerales/depósitos (incluida la redefinición de l huellas) y  modelos de alteración en 2D. Los conjuntos de datos geofísicos y de teledetección incluían datos magnéticos, electromagnéticos,  gravedad, radiometría menor, modelos digitales de terreno e imágenes satelitales  (ASTER, Sentinel 2). 

Las entradas de datos escasas y no uniformes, como la geoquímica, se utilizaron generalmente como elementos de datos confirmatorios en lugar de obligatorios en los modelos de potencial mineral, reduciendo  la dependencia de la imputación (el proceso de reemplazar los datos faltantes con valores sustituidos). 

También se generó un modelo litoestructural 3D del área de interés, centrándose en desarrollar el marco estructural e intrusivo para proporcionar un marco estructural y geológico en 3D del área de interés para ayudar a comprender mejor la arquitectura de la región y evaluar los controles subyacentes de los depósitos de pórfido de cobre  en 3D, así como  proporcionar una extensión del marco de selección en 2D a 3D para probar la aplicabilidad de la selección en 3D a escala regional. 

Se utilizó un extenso conjunto de datos de entrada y una red de inferencia para generar los modelos finales de potencial mineral a través de varias iteraciones, utilizando flujos de trabajo de lógica difusa bien establecidos y análisis de datos avanzados. Los resultados del análisis de datos necesitaban  identificar ubicaciones conocidas de depósitos de pórfido de cobre con un alto nivel de precisión como primer paso para demostrar un enfoque  creíble y potencialmente robusto para la exploración. . 

El potencial mineral basado en ML se estimó en 2D y 3D utilizando marcos de computación en la nube distribuidos y escalables. Los mejores resultados se fusionaron con los resultados basados en la lógica difusa impulsada por  el conocimiento geológico utilizando un enfoque de fusión para delinear las áreas de interés. 

Entre los principales resultados figuran  

  • Unas pocas capas de pruebas  clave fueron los principales impulsores. 
  • La mayoría de ellos fueron el resultado de la mejora y reinterpretar de conjuntos de datos geológicos, incluida la creación de otros nuevos. 
  • Varios de los nuevos mapas  fueron también herramientas importantes en el proceso de revisión y análisis iterativo (incluida la revisión por pares especialistas). 
  • Las capas de intrusión (cerca de la superficie y en profundidad) y las estructuras principales fueron capas de evidencia importantes en los modelos finales de potencial mineral derivados tanto del conocimiento geológico como del modelado basado en ML. 
  • La cartografía de la alteración magnética se señaló como un factor adicional en la modelización ML. 

Conclusiones: 

  • Un enfoque productivo y colaborativo permitió una poderosa fertilización cruzada de ideas sin que un especialista o equipo de especialistas impulsara los resultados. Una aplicación matizada de análisis de datos dentro de un marco de sistema mineral es óptima para aplicaciones regionales en áreas no exploradas. 
  • La mejora y la creación de nuevos conjuntos de datos, basados en conocimientos geológicos, fueron muy importantes para los resultados obtenidos por este estudio. 
  • La introducción de un modelo de fusión basado en ML fue fundamental para generar modelos óptimos de potencial mineral. La fusión es un medio eficaz de combinar un conjunto de modelos complementarios, incluidos  modelos basados en el conocimiento, que capturan el conocimiento experto y los modelos de aprendizaje profundo que se basan en los datos. 
  • Las entradas de datos escasas y no uniformes pueden usarse como elementos de datos confirmatorios en lugar de obligatorios. La síntesis de entradas de datos escasas en proxies geológicos es una estrategia eficaz en entornos de datos deficientes. 
  • Se identificaron varias áreas de alta prospectividad para una revisión más detallada en una región bien explorada.