Machine Learning in Prospectivity Analysis

Machine Learning em Análise de Prospectividade 

Em nome da BHP, a SRK Consulting e a DeepIQ firmaram uma parceria em uma iniciativa para adaptar uma abordagem combinada com o objetivo de aprimorara modelagem de prospectividade. Ao combinar processamento avançado de dados, compilação de conhecimento, interpretação geológica e machine learning (ML), a equipe investigou várias abordagens para apoiar a descoberta de grandes depósitos de cobre pórfiro em uma região já bem explorada no norte dos Andes chilenos. 

O estudo utilizou uma abordagem de sistema mineral para abordar os dados disponíveis. Com base no conhecimento geológico global e local, os principais vetores de exploração e critérios para depósitos de cobre pórfiro foram tabulados sobre a Área de Interesse. Todas as informações valiosas foram extraídas de conjuntos de dados regionais disponíveis usando uma ampla gama de métodos e algoritmos de interpretação e processamento. Quando os conjuntos de dados não apresentavam robustez suficiente, foram reelaborados para garantir que estivesse prontos para integração em fluxo de trabalho baseado em ML. As informações foram convertidas em camadas de evidência e os dados multimodais foram inseridos em uma plataforma de dados em nuvem, integrados para formar um conjunto de dados aptos para análise.Esses dados foram analisados usando uma combinação de algoritmos orientados pelo conhecimento e algoritmos avançados de ML e  deep learning, com um ciclo iterativo de feedback para incorporar os pontos fortes e fracos de cada abordagem. 

Os benefícios da combinação do conhecimento geológico com o ML incluem uma abordagem mais objetiva, minimização do viés humano e a rápida análise de grandes quantidades de dados. No entanto, o ML pode estar sujeito a vieses, como os decorrentes dos dados utilizados ou das relações entre os dados e os processos geológicos ou características de interesse. A seleção inadequada de dados, dados de baixa qualidade ou uma ligação tênue entre os dados e a característica geológicapodem gerar resultados insatisfatórios. A combinação diferenciada de geociência e ciência de dados pode ajudar a minimizar esses vieses e levar a melhores resultados. 

Os resultados da análise de dados, que identificaram locais de depósito de cobre pórfiro com alto grau de precisão, foram o primeiro passo para demonstrar uma abordagem confiável e potencialmente robusta para exploração mineral. Centenas de conjuntos de dados individuais foram gerados durante o estudo, além daqueles inicialmente fornecidos à equipe. Os conjuntos de dados relacionados ao modelo de sistema mineral foram considerados no ciclo de feedback entre geocientistas e cientistas de dados, o que melhorou a compreensão dos resultados do modelo e refinou as saídas. 

Os conjuntos de dados geológicos incluíram interpretações de geologia sólida, reinterpretação de estruturas, análise de dados geoquímicos, ocorrências de minerais e depósitos (incluindo redefinição de pegadas), além de modelos de alteração 2D. Os dados geofísicos e de sensoriamento remoto incluíram magnetismo, eletromagnetismo, gravidade, radiometria e modelos digitais de terreno, além de imagens de satélite (ASTER, Sentinel 2). 

Dados escassos e não uniformes, como os geoquímicos, foram geralmente usados como elementos confirmatórios, em vez de obrigatórios, nos modelos de potencial mineral, reduzindo a dependência da imputação (processo de substituição de dados ausentes). Um modelo litoestrutural 3D da Área de Interesse foi gerado, com foco no desenvolvimento da estrutura geológica e intrusiva para melhor compreensão da arquitetura da região e dos controles subjacentes dos depósitos de cobre pórfiro em 3D. A estrutura 2D também foi expandida para 3D, testando a aplicabilidade da modelagem em escala regional. 

Um extenso conjunto de dados de entrada e uma rede de inferência foram utilizados para gerar os modelos finais de potencial mineral, por meio de várias iterações, usando fluxos de trabalho de lógica difusa e análise de dados avançada. O potencial mineral baseado em ML foi estimado em 2D e 3D, utilizando estruturas de computação em nuvem distribuídas e escaláveis. Os melhores resultados foram mesclados com saídas baseadas em lógica difusa, orientadas pelo conhecimento geológico, utilizando uma abordagem de Fusão para delimitar áreas de interesse. 

Os principais resultados incluíram: 

  • Algumas das principais camadas probatórias foram os principais impulsionadores. 
  • A maioria delas resultou do aprimoramento e reinterpretação de conjuntos de dados geológicos, incluindo a criação de novos. 
  • Vários dos novos mapas também foram ferramentas importantes no processo de revisão e análise iterativa (incluindo revisão especializada por pares). 
  • As camadas de intrusão (perto da superfície e em profundidade) e as principais estruturas foram importantes camadas de evidência nos modelos finais de potencial mineral derivados tanto do conhecimento geológico quanto da modelagem baseada em ML. 
  • O mapeamento de alterações magnéticas foi observado como um driver adicional na modelagem de ML. 

Conclusões: 

  • Uma abordagem produtiva e colaborativa permitiu uma fomentação poderosa de troca de ideias sem um especialista ou equipe especializada que gere resultados. Uma aplicação diferenciada de análise de dados dentro de uma estrutura de sistema mineral é ideal para aplicações regionais greenfield. 
  • Os conjuntos de dados novos e aprimorados, baseados em conhecimento geológico foram muito importantes para os resultados alcançados por este estudo. 
  • A introdução de um modelo de Fusão baseado em ML foi fundamental na geração de modelos de um adequado potencial mineral. A Fusão é um meio eficaz de combinar um conjunto de modelos complementares, incluindo modelos baseados em conhecimento, que capturam conhecimento especializado e modelos de aprendizagem profunda orientados por dados. 
  • Entradas de dados escassas e não uniformes podem ser usadas como elementos de dados confirmatórios em vez de obrigatórios. A síntese de entradas de dados escassas em proxies geológicos é uma estratégia eficaz em ambientes de dados precários. 
  • Várias áreas de alta prospectividade foram identificadas para uma revisão mais detalhada em uma região bem explorada.