Разработка алгоритмов машинного обучения и анализа больших данных в области спектроскопии рентгеновского поглощения

РФФИ. Перспектива. Бугаев. 2019-2021

Дата начала работ по гранту: 01.10.2019
Дата окончания работ по гранту: 31.10.2022
Руководитель: Бугаев Арам Лусегенович

Развитие современных источников синхротронного излучения и технической базы экспериментальных станций позволяет измерять спектры рентгеновского поглощения с милли- и микросекундным разрешением по времени, что неминуемо ведет к увеличению количества спектров, получаемых в рамках отдельного эксперимента, и ставит исследователя перед необходимостью обработки больших массивов спектроскопических данных. Данный проект направлен на разработку комплексной методики автоматического и полуавтоматического анализа больших объемов спектроскопических данных с применением современных алгоритмов статистического анализа, включая метод чередующихся наименьших квадратов для решения задачи разрешения кривых, а также методов машинного обучения и искусственного интеллекта. В результате выполнения проекта будет разработан программный продукт, который позволит производить обработку экспериментальных спектров рентгеновского поглощения в режиме реального времени непосредственно в ходе проведения измерений. В частности, такой продукт будет установлен на экспериментальных станциях, с целью предоставления пользователю моментальной качественной и количественной информации об исследуемом образце.

В рамках первого года выполнения проекта были разработаны оригинальные программные коды, реализующие ряд современных методов для статистического анализа больших данных, включая MCR-ALS, и методы машинного обучения «с учителем», которые были успешно апробированы на различных массивах теоретических и экспериментальных спектров рентгеновского поглощения. Для анализа больших данных был использован широкий набор статистических критериев, позволяющих определить количество независимых состояний системы в ходе её эволюции под действием температуры, давления и в условиях протекания химических реакций. Такой подход в первую очередь эффективен для обработки больших объемов спектральных данных, измеренных в условиях in situ и operando, в том числе, с высоким разрешением по времени, и не требует наличия спектров образцов-сравнения для дальнейшего анализа. Методы машинного обучения базировались на расчете большой обучающей выборки теоретических спектров для тренировки алгоритмов, которые в дальнейшем могут сопоставить каждому экспериментальному спектру соответствующие параметры атомной структуры образца. Ключевой особенностью метода является возможность его применения не только к спектрам EXAFS, но и XANES, анализ которых в литературе зачастую сводиться к качественному сравнению с известными спектрами. Разработанные теоретические методики были успешно применены для решения нескольких практически важных задач: контроль образование поверхностных и объемных оксидных фаз в наночастицах палладия в присутствии кислорода и водорода, исследование динамики активных центров никеля в ходе димеризации этилена, и определение трехмерной атомной структуры комплексов золота. По результатам работы были представлены доклады на международных конференциях и подготовлены статьи для публикации в журналах первого квартиля.



Публикации по направлению


Всего отобрано 1 публикаций с суммарным значением Impact-factor = 5.996

1. A. Bugaev, M. Zabilskiy, A. Skorynina, O. Usoltsev, A. Soldatov, J. van Bokhoven "In situ formation of surface and bulk oxides in small palladium nanoparticles" Chemical Communications 2020 56 13097-13100 (Journal Cover) (Impact-factor: 5.996 ) DOI: 10.1039/D0CC05050D