Студент НИТУ МИСИС описал метод, который позволит материаловедам сэкономить время при расшифровке рентгенограмм. Он предложил использовать машинное обучение для прогнозирования фаз кристаллической структуры переходных металлов и их оксидов на основе данных рентгеновской дифракции. Статья вошла в сборник «ML4Materials» конференции International Conference on Learning Representations (ICLR), которая является самой престижной в мире в сфере ИИ согласно среднему индексу цитирования Google.
Один из основных методов, используемых в материаловедении — рентгенофазовый анализ — основан на получении данных о химическом составе материала при помощи рентгеновской дифракции. На практике в процессе производства и во время дифракции в установке дифрактометра образуются различные оксиды и лишние соединения, которые могут мешать идентификации фаз материала, поэтому по-прежнему существует потребность в более надежных и точных методах определения элементов на дифрактограммах.
Машинное обучение уже давно используется для прогнозирования свойств материалов, анализа кристаллической структуры и классификации дифракционных картин. База данных рентгенограмм позволяет проводить идентификацию более конкретным и целенаправленным образом, снижая вероятность ошибок интерпретации. Однако ранее в научных работах такие подходы практически не применялись по отношению к оксидам переходных металлов, которые используются в различных областях — от трубопроводного транспорта до электронных приборов.
«Метод состоит из трех этапов. Сначала, собираются признаки о пиках на спектограммах, то есть подсчитывается позиция, величина, расстояние и площадь каждого пика. Стоит обратить внимание на главный признак — площадь графика между пиками. Он позволяет сравнивать паттерны дифракций разных веществ и находить точные совпадения. С помощью данного алгоритма идет подсчет количества совпадений. Так как пики могут иметь различные отклонения, используется машинное обучение. Полученные признаки, включая количество совпавших пиков, подается в классические алгоритмы машинного обучения для корректировки итогового результата. Самой лучшей моделью стал случайный лес с увеличенной глубиной», — рассказал автор исследования Максим Жданов.
Одной из ключевых функций, используемых для этого анализа, является расчет площади пиков, который применяется для количественной оценки интенсивности дифракционных пиков. Этот аспект позволяет более точно и быстро идентифицировать различные фазы в рентгенограммах, что в будущем может значительно сэкономить время ученому при исследовании материала.
Описанный метод имеет свои ограничения. Идентификация близких фаз по-прежнему может быть неточной в случаях, где рисунок и кристаллическая структура различаются по ряду причин. Помимо прочего, на точность идентификации влияет состояние дифрактометра и предыдущие проведенные эксперименты.
«Сейчас предложенным методом трудно работать с задачами, где встречается множество разных веществ. Стоит попробовать применение нейронных сетей со структурированным латентным пространством, например, как в вариационных автоэнкодерах, для извлечения более важных признаков из разных групп материалов», — отметил Максим Жданов.
В будущих исследованиях будет расширен спектр материалов, а также в перспективе проведение тестов на реальных данных.