Нейросети могут ускорить уже известные методы обнаружения трещин и залегания пластов пород в земной коре. Пока такие расчеты представляют собой длительный, сложный и вычислительно-емкий процесс. Технологии искусственного интеллекта помогают решить эту задачу гораздо быстрее и выдать изображение, которое ученые-геофизики смогут интерпретировать. Только сначала нейросетевую модель необходимо обучить таким расчетам. Этим в настоящий момент занимаются научные сотрудники Лаборатории аналитики потоковых данных и машинного обучения Механико-математического факультета Новосибирского государственного университета.
Первые результаты обучения нейросети были представлены исследователями в июне этого года на международной конференции по вычислительной науке и компьютерным приложениям, которая проходила в Афинах в режиме онлайн. Позднее эти данные опубликовали на ресурсе SpringerLink. Сейчас участники данного проекта готовятся к публикации новых результатов. За последнее время им удалось значительно продвинуться в обучении нейросетей «видеть» сквозь пласты земной коры. Об этом рассказывает заведующий лабораторией Евгений Павловский.
— Мы выполняем эту работу совместно с коллегами из Института нефтегазовой геологии и геофизики им. А.А. Трофимука в рамках предоставленного им гранта от РНФ. Они связались с нами и предложили присоединиться к их проекту. Нам предложение показалось интересным, ведь это еще одно применение машинного обучения. Мы наглядно видим, что нейросетевые модели стали неким инструментом исследователя, как в свое время тот же микроскоп, который позволяет на новом уровне решать стоящие до его появления задачи, — пояснил Евгений.
Со своей стороны научные сотрудники ИНГГ СО РАН предоставили ученым лаборатории необходимые для работы сейсмические данные, а также просчитанные ими математические модели, представляющие собой правильные ответы. Такой подход к созданию синтетических данных на основе модели называется суррогатным моделированием.
— Мы знали, где находятся трещины и какие породы залегают на определенной глубине. Оставалось ввести данные датчиков, посмотреть, какие ответы даст нам нейросеть в результате машинного обучения и оценить, насколько они совпадут с «правильными», то есть модельными, — рассказал Евгений Павловский.
Чтобы обучить нейросетевую модель, исследователи провели множество различных экспериментов. В результате были выбраны архитектура UNet и оптимизатор – AdamW. С их помощью удалось восстановить трещины в модели. Однако доля совпадений по метрике Дайса на тесте составила 30 %.
— Это очень неплохой результат. Мы опубликовали его в недавно вышедшей статье. Но процент совпадений реальных результатов и расчетов нейросетей можно повышать. Поэтому мы продолжили эксперименты. Теперь этот показатель достигает 65 %. Об этом написано еще две статьи, которые в ближайшем будущем будут опубликованы в научных изданиях. Далее мы намерены выйти на результат в 80 %. И в скором времени перейти с модельных данных на реальные, — делится планами заведующий лабораторией.
Евгений Павловский отметил, что переход от модельных данных к реальным будет очень сложным. В модели не учитываются многие другие факторы, встречающиеся в реальной ситуации, а нейросеть довольно зависима от специфики исходных данных, на которых ее обучили.
Первые попытки работать с реальными данными оказались не слишком удачными. И исследователи добавили к готовым моделям новые приемы – правдоподобные шумы, смещения и перемешивания сигналов. Выданное нейросетью графическое изображение оказалось не таким качественным, как получаемое на суррогатных моделях, но это стало первым шагом к переходу на реальные данные. Потребуется поиск нетривиальных подходов к обучению нейросети, множество экспериментов и вычислений. Евгений Павловский уточняет, что при этом используются вычислительные ресурсы его лаборатории, но в дальнейшем не исключено, что придется задействовать университетский суперкомпьютер.