Статья наших сотрудников «The CSD and knowledge databases: from answers to questions» попала в тематическую подборку «горячих» статей журнала CrystEngComm. В публикации обсуждается ряд вопросов, связанных с машинным обучением и скринингом баз данных.
«CrystEngComm» – рецензируемый научный онлайн-журнал Королевского химического общества, в котором публикуются оригинальные исследования и обзорные статьи об инженерии кристаллов, свойствах и полиморфизме кристаллов, кристаллических материалах и наноматериалах. Выпуски журнала выходят в свет 2 раза в месяц. Импакт-фактор журнала CrystEngComm в 2018 году составлял 3,382.
Соавторами статьи выступили старший научный сотрудник лаборатории кристаллохимии и дизайна кристаллов МНИЦТМ Александр Шевченко, старший научный сотрудник лаборатории математического моделирования материалов МНИЦТМ Роман Еремин и директор МНИЦТМ профессор Владислав Блатов.
В статье обсуждается общая схема получения информации о кристаллических структурах из кристаллографических баз данных. Эта схема иллюстрируется примером создания базы данных, содержащей ряд структурных дескрипторов, которые отражают геометрические и топологические свойства координационных соединений. Первоначальная кристаллографическая информация о 7690 кристаллических структурах была получена в основном из Кембриджской базы данных структур и обработана с помощью программного пакета ToposPro. Авторы использовали ряд методов машинного обучения для разработки схемы прогнозирования и доказали, что метод «Random forest» обеспечивает наилучшее прогнозирование общих топологических свойств координационных сеток (размерности и базовой топологии). Также авторы показали, что разработанную базу знаний и прогностическую схему можно рассматривать как прототип системы искусственного интеллекта, который может использоваться для ответа на типовые вопросы, возникающие при дизайне координационных соединений.