Машинное обучение в анализе перспективности

Машинное обучение в анализе перспективности 

По поручению BHP компании SRK Consulting и DeepIQ  выполнили совместную работу в рамках инициативы по разработке комбинированного подхода к улучшению моделирования перспективности. Объединив передовые методы обработки данных, компиляции знаний, геологической интерпретации и машинного обучения (МО), группа изучила несколько подходов с целью обоснования разработки крупных месторождений медно-порфировой руды в хорошо освоенном регионе на севере чилийских Анд. 

Для проведения анализа имеющихся данных в исследовании использовался подход к минерально-сырьевой системе. На основе глобальных и локальных геологических знаний были составлены таблицы основных направлений и критериев разведки месторождений медно-порфировых руд на перспективном участке. Вся ценная информация была извлечена из доступных региональных наборов данных с использованием широкого спектра методов и алгоритмов интерпретации и обработки. В тех случаях, когда региональные наборы данных считались недостаточно надежными, они были переработаны, чтобы обеспечить их пригодность для интеграции в рабочий процесс на основе машинного обучения. Информация была преобразована в доказательные слои, а многомодальные наборы данных были загружены в облачную платформу данных и интегрированы для формирования готового к аналитике набора данных. Данные анализировались с использованием комбинации алгоритмов, основанных на знаниях и на передовых технологиях машинного и глубокого обучения, при этом различные сильные и слабые стороны каждого подхода были включены в итеративный цикл обратной связи. 

Преимущества объединения геологических знаний с МО заключаются в том, что МО обеспечивает более объективный подход, минимизацию человеческого фактора и быстрое выполнение анализа больших объемов данных. Однако машинное обучение может быть подвержено погрешностям (например, из-за данных, используемых для обучения, и/или взаимосвязей между данными и геологическими процессами и/или представляющими интерес характеристиками). Неправильный выбор данных, их низкое качество, слабая или сложная связь между данными и интересующим геологическим объектом или месторождением могут привести к неблагоприятным результатам. Дифференцированное, учитывающее все нюансы сочетание наук о Земле и имеющихся данных может помочь минимизировать эти погрешности и обеспечить более оптимальные результаты. 

Результаты анализа данных, необходимые для определения известных мест залегания месторождений медно-порфировых руд с высокой степенью точности, стали первым шагом на пути к демонстрации надежного и потенциально достоверного подхода к геологоразведке. 

В ходе исследования были созданы сотни отдельных наборов данных в дополнение к тем, которые изначально были предоставлены исследовательской группе. При принятии решения о том, какие наборы данных следует использовать для моделирования минерально-сырьевого потенциала, в процессе обратной связи между геологами и специалистами по данным всегда учитывалось то, как наборы данных соотносятся с моделью минерально-сырьевой системы. Этот процесс обратной связи улучшил понимание выходных данных/результатов модели и последующее уточнение выходных данных. 

Наборы геологических данных включали в себя интерпретацию геологии твердых полезных ископаемых, повторную интерпретацию структур, анализ геохимических данных, залежи минералов/месторождений (включая переопределение занимаемой площади) и двухмерные модели изменений. Геофизические и дистанционно зондируемые данные включали в себя магнитные, электромагнитные, гравитационные, малые радиометрические данные, цифровые модели рельефа и спутниковые изображения (ASTER, Sentinel 2). 

В моделях минерально-сырьевого потенциала разрозненные и неоднородные входные данные, в частности, геохимические, обычно использовались в качестве подтверждающих, а не обязательных элементов данных, что снижало зависимость от подстановки (процесса замены отсутствующих данных замещающими значениями). 

Также была создана трехмерная литоструктурная модель перспективного участка с упором на разработку структурного и интрузивного каркаса для предоставления трехмерного структурного и геологического каркаса перспективного участка. Это было сделано с целью получения представления о строении региона и оценки контроля за нижележащими месторождениями медно-порфировой руды в трехмерном пространстве, а также для расширения двухмерной структуры таргетирования до трехмерной с целью проверки применимости трехмерного таргетирования в региональном масштабе. 

Для создания окончательных моделей минерально-сырьевого потенциала с помощью нескольких итераций с использованием хорошо зарекомендовавших себя рабочих процессов нечеткой логики и расширенной аналитики данных применялся обширный набор входных данных и сеть логических выводов. Результаты анализа данных, необходимые для определения известных мест залегания месторождений медно-порфировых руд с высокой степенью точности, стали первым шагом на пути к демонстрации надежного и потенциально достоверного подхода к геологоразведке. 

Оценка минерально-сырьевого потенциала на основе МО выполнялась в двух- и трехмерных моделях с использованием распределенных и масштабируемых облачных вычислительных структур. Оптимальные результаты были объединены с выводами, полученными на основе нечеткой логики, основанными на геологических знаниях, с использованием подхода слияния для определения целевых областей. 

Основные результаты: 

Основными факторами стали несколько ключевых доказательных слоев. 

Большинство из них были определены в результате улучшения и переосмысления наборов геологических данных, включая создание новых наборов. 

Некоторые из новых карт также стали важными инструментами в процессе проверки и итеративного анализа (включая экспертную оценку специалистов). 

Интрузивные слои (вблизи поверхности и на глубине) и основные структуры были важными доказательными слоями в окончательных моделях минерально-сырьевого потенциала, полученных как на основе геологических знаний, так и моделирования на основе МО. 

Картографирование магнитных изменений было отмечено как дополнительный фактор при моделировании методом МО. 

Выводы: 

  • Продуктивный совместный подход позволил добиться эффективного обмена идеями, при этом ни один специалист или группа специалистов не оказывали влияния на результаты. Дифференцированное, учитывающее все нюансы применение аналитики данных в рамках минерально-сырьевой системы является оптимальным для региональных месторождений, разрабатываемых с нуля. 
  • В результатах, достигнутых в ходе этого исследования, большую роль сыграли расширенные и новые наборы данных, основанные на геологических знаниях. 
  • Важную роль в создании оптимальных моделей минерально-сырьевого потенциала сыграло внедрение модели слияния на основе МО.  Слияние — это эффективный способ объединения набора взаимодополняющих моделей, включая модели, основанные на знаниях и охватывающие экспертные знания, а также модели глубокого обучения, основанные на данных. 
  • Разрозненные и неоднородные входные данные могут использоваться как подтверждающие, а не обязательные элементы данных. Синтезирование разрозненных входных данных в геологические прокси-данные является эффективной стратегией в условиях недостаточности данных. 
  • Для дальнейшего детального изучения было выявлено несколько высокоперспективных участков в хорошо изученном регионе.