Участник:Igor Baskin
Материал из MachineLearning.
(→Ссылки) |
(→Оригинальные статьи в журналах) |
||
(28 промежуточных версий не показаны.) | |||
Строка 4: | Строка 4: | ||
'''Баскин Игорь Иосифович''' | '''Баскин Игорь Иосифович''' | ||
- | + | д.ф.-м.н. | |
Ведущий научный сотрудник [http://www.chem.msu.ru Химического факультета МГУ им. М. В. Ломоносова] | Ведущий научный сотрудник [http://www.chem.msu.ru Химического факультета МГУ им. М. В. Ломоносова] | ||
Строка 18: | Строка 18: | ||
* [[Нейронные сети]] | * [[Нейронные сети]] | ||
- | * Интеллектуальный анализ данных | + | * Интеллектуальный анализ химических данных |
- | * | + | * Визуализация химического пространства |
+ | * Ядерные методы машинного обучения в применении к объектам, описываемым непрерывными функциями | ||
* [[Метод опорных векторов]] | * [[Метод опорных векторов]] | ||
+ | * Метод генеративных топологических карт (GTM) | ||
* Многозадачное обучение, индуктивный перенос знаний | * Многозадачное обучение, индуктивный перенос знаний | ||
+ | * Одноклассовая классификация | ||
* Трансдуктивные методы обучения | * Трансдуктивные методы обучения | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
== Избранные публикации (из > 300) == | == Избранные публикации (из > 300) == | ||
Строка 43: | Строка 39: | ||
# Баскин И. И., Палюлин В. А., Зефиров Н. С. Многослойные персептроны в исследовании зависимостей «структура-свойство» для органических соединений // Российский химический журнал (Журнал Российского химического общества им. Д. И. Менделеева), 2006, Т. 50, С. 86-96 | # Баскин И. И., Палюлин В. А., Зефиров Н. С. Многослойные персептроны в исследовании зависимостей «структура-свойство» для органических соединений // Российский химический журнал (Журнал Российского химического общества им. Д. И. Менделеева), 2006, Т. 50, С. 86-96 | ||
# Baskin I., Varnek A. Building a chemical space based on fragment descriptors // Combinatorial Chemistry & High Throughput Screening, 2008, V. 11, No. 8, P. 661—668 | # Baskin I., Varnek A. Building a chemical space based on fragment descriptors // Combinatorial Chemistry & High Throughput Screening, 2008, V. 11, No. 8, P. 661—668 | ||
+ | # Varnek A., Baskin I. I. Chemoinformatics as a Theoretical Chemistry Discipline // Molecular Informatics, 2011, V. 30, No. 1, P. 20-32. | ||
+ | # Varnek A., Baskin I. Machine Learning Methods for Property Prediction in Chemoinformatics: Quo Vadis? // Journal of Chemical Information and Modeling, 2012, V. 52, No. 6, P. 1413-1437. | ||
=== Оригинальные статьи в журналах === | === Оригинальные статьи в журналах === | ||
Строка 58: | Строка 56: | ||
# Varnek A., Gaudin C., Marcou G., Baskin I., Pandey A.K., Tetko I.V. Inductive Transfer of Knowledge: Application of Multi-Task Learning and Feature Net Approaches to Model Tissue-Air Partition Coefficients // J. Chem. Inf. Model., 2009, V. 49, № 1, P. 133—144 | # Varnek A., Gaudin C., Marcou G., Baskin I., Pandey A.K., Tetko I.V. Inductive Transfer of Knowledge: Application of Multi-Task Learning and Feature Net Approaches to Model Tissue-Air Partition Coefficients // J. Chem. Inf. Model., 2009, V. 49, № 1, P. 133—144 | ||
# Баскин И. И., Жохова Н. И., Палюлин В. А., Зефиров А. Н., Зефиров Н. С. Многоуровневый подход к прогнозированию свойств органических соединений в рамках методологии исследования количественных соотношений «структура-свойство/структура-активность» // Докл. РАН, 2009, Т. 427, № 3, С. 335—339 | # Баскин И. И., Жохова Н. И., Палюлин В. А., Зефиров А. Н., Зефиров Н. С. Многоуровневый подход к прогнозированию свойств органических соединений в рамках методологии исследования количественных соотношений «структура-свойство/структура-активность» // Докл. РАН, 2009, Т. 427, № 3, С. 335—339 | ||
- | # Кондратович Е. П., Жохова Н. И., Баскин И. И., Палюлин В. А., Зефиров Н. С. Фрагментные дескрипторы при исследовании соотношений структура-активность: применение для прогнозирования принадлежности органических соединений к фармакологическим группам с использованием метода опорных векторов // Известия Академии наук. Серия химическая, 2009, № 4, С. 641—647 | + | # Кондратович Е. П., Жохова Н. И., Баскин И. И., Палюлин В. А., Зефиров Н. С. Фрагментные дескрипторы при исследовании соотношений структура-активность: применение для прогнозирования принадлежности органических соединений к фармакологическим группам с использованием метода опорных векторов // Известия Академии наук. Серия химическая, 2009, № 4, С. 641—647. |
+ | # Baskin I.I., Kireeva N., Varnek A. The One‐Class Classification Approach to Data Description and to Models Applicability Domain // Molecular Informatics, 2010, V. 29, No. 8‐9, P. 581-587. | ||
+ | # Kireeva N., Baskin I. I., Gaspar H. A., Horvath D., Marcou G., Varnek A. Generative Topographic Mapping (GTM): Universal Tool for Data Visualization, Structure‐Activity Modeling and Dataset Comparison // Molecular Informatics, 2012, V. 31, No. 3‐4, P. 301-312. | ||
=== Статьи в сборниках === | === Статьи в сборниках === | ||
Строка 71: | Строка 71: | ||
# Айт А. О., Баскин И. И., Гальберштам Н. М. Прогнозирование физико-химических свойств симметричных цианиновых красителей с использованием методологии искусственных нейронных сетей // Труды VII Всероссийской конференции «Нейрокомпьютеры и их применение». НКП-2001 с международным участием. — 2001. — С.411-413 | # Айт А. О., Баскин И. И., Гальберштам Н. М. Прогнозирование физико-химических свойств симметричных цианиновых красителей с использованием методологии искусственных нейронных сетей // Труды VII Всероссийской конференции «Нейрокомпьютеры и их применение». НКП-2001 с международным участием. — 2001. — С.411-413 | ||
# Baskin I.I., Halberstam N.M., Artemenko N.V., Palyulin V.A., Zefirov N.S. NASAWIN — a universal software for QSPR/QSAR studies // EuroQSAR 2002 Designing Drugs and Crop Protectants: processes, problems and solutions / Eds., M.Ford et al: Blackwell Publishing, 2003, P.260-263. | # Baskin I.I., Halberstam N.M., Artemenko N.V., Palyulin V.A., Zefirov N.S. NASAWIN — a universal software for QSPR/QSAR studies // EuroQSAR 2002 Designing Drugs and Crop Protectants: processes, problems and solutions / Eds., M.Ford et al: Blackwell Publishing, 2003, P.260-263. | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
== Проекты == | == Проекты == | ||
=== Обратная задача в проблеме «структура-свойство» === | === Обратная задача в проблеме «структура-свойство» === | ||
- | В | + | В 1989 г. нами впервые была сформулирована т. н. обратная задача в проблеме «структура-свойство», суть которой заключается в поиске структур химических соединений, обладающих свойствами, лежащими в пределах заранее заданных интервалов <ref>Баскин И. И., Гордеева Е. В., Девдариани Р. О., Зефиров Н. С., Палюлин В. А., Станкевич М. И., «Методология решения обратной задачи в проблеме связи „структура-свойство“ для случая топологических индексов» // ДАН СССР, 1989, Т. 307, № 3, С. 613—616</ref>. Эта задача была нами решена для некоторых примеров путем ее сведения к комбинаторной задаче из области дискретной математики по перечислению графов, значения определенных инвариантов которых лежат в заданных интервалах <ref>Скворцова М. И., Баскин И. И., Палюлин В. А., Словохотова О. Л., Зефиров Н. С., «Обратная задача в QSAR/QSPR-анализе для случая топологических индексов, характеризующих молекулярную форму (индексов Кира) // ДАН, 1992, т.324, № 2, С. 344—348»</ref><ref>Скворцова М.И., Баскин И.И., Палюлин В.А., Словохотова О.Л., Зефиров Н.С., "Обратная задача в проблеме свя-зи структура-свойство для случая корреляционного уравнения, содержащего произвольные топологические дескрипторы" // Докл. РАН, 1996, Т. 346, № 4, С. 497-500</ref><ref>Скворцова М.И., Словохотова О.Л., Баскин И.И., Палюлин В.А., Зефиров Н.С., "Обратная задача в проблеме связи структура-свойство для случая информационных топологических индексов" // Докл. РАН, ДАН, 1997, Т. 357, №1, С. 72-74.</ref> (см. обзор<ref>Skvorsova M.I., Baskin I.I., Palyulin V.A., Slovokhotova O.L., Zefirov N.S., "Structural design. Inverse problems for topological indices in QSAR/QSPR studies" // AIP Conf. Proc. 330. E.C.C.C.1 Comput. Chem. F.E.C.S. Conf., Nancy, France / Ed. by Bernardi F., Rivail J.-L. - Woodbury, N.Y.: AIP Press, 1995, P. 486-499</ref>). С тех пор понятие об обратной задаче в проблеме «структура-свойство» прочно вошло в область хемоинформатики, а первая наша статья на эту тему на английском языке до сих пор является самой цитируемой из моих публикаций<ref>Skvortsova M.I., Baskin I.I., Slovokhotova O.L., Palyulin V.A., Zefirov N.S., "The Inverse Problem in QSAR/QSPR Studies for the Case of Topological Indices Characterizing Molecular Shape (Kier Indices)" // J. Chem. Inf. Comput. Sci., 1993, V. 33, No. 4, P. 630-634</ref>. |
В настоящий момент мною идет переосмысление этой задачи и в дальнейшем планируется ее переформулировать как задачу построения генеративных статистических моделей, позволяющих по заданному набору свойств найти условное статистическое распределение графов, процедуру сэмплинга из которого можно рассматривать как стохастический генератор химических структур, обладающих заранее заданным набором свойств. До самого последнего времени построение подобных моделей не представлялось реальным ввиду практически полной неразвитости математического аппарата построения генеративных статистических моделей графов, однако за последние несколько лет был опубликован ряд важных работ в этом направлении, которые позволяют взглянуть на эту область с определенным оптимизмом. | В настоящий момент мною идет переосмысление этой задачи и в дальнейшем планируется ее переформулировать как задачу построения генеративных статистических моделей, позволяющих по заданному набору свойств найти условное статистическое распределение графов, процедуру сэмплинга из которого можно рассматривать как стохастический генератор химических структур, обладающих заранее заданным набором свойств. До самого последнего времени построение подобных моделей не представлялось реальным ввиду практически полной неразвитости математического аппарата построения генеративных статистических моделей графов, однако за последние несколько лет был опубликован ряд важных работ в этом направлении, которые позволяют взглянуть на эту область с определенным оптимизмом. | ||
- | === | + | === Теоремы о базисе инвариантов графов и ее значение для прогнозирования свойств органических соединений === |
+ | В середине 90-ых годов нами были сформулированы и доказаны две теоремы о базисе инвариантов графов. | ||
+ | |||
+ | '''Теорема 1'''. Любой инвариант <tex>f(H)</tex> помеченного графа <tex>H \in H_{V,E}^{(n)}</tex> может быть единственным образом представлен в виде: | ||
+ | ::<tex>f(H) = \sum\limits_j c_jg_j(H)</tex> | ||
+ | где: <tex>H_{V,E}^{(n)}</tex> - множество всех возможных помеченных графов с максимальным числом вершин <tex>n</tex>; <tex>c_j</tex> – некоторые константы, не зависящие от <tex>H</tex> и зависящие от <tex>f</tex>; <tex>g_j(H)</tex> – число вложений графа <tex>H_{V,E}^{(n)}</tex> в граф <tex>H</tex> (т.е. количество различных подграфов графа <tex>H</tex>, изоморфных <tex>H_j</tex>). Таким образом, множество <tex>g_j</tex> образует базис в алгебре инвариантов графов из множества <tex>H_{V,E}^{(n)}</tex>. Суммирование ведется по подграфам <tex>H_j</tex>, получаемым из <tex>H</tex> путем удаления ребер всеми неэквивалентными способами. | ||
+ | |||
+ | '''Теорема 2'''. Любой инвариант <tex>f(H)</tex> помеченного графа <tex>H_{V,E}^{(n)}</tex> может быть представлен в виде полинома от переменных, равных числам встречаемости некоторых связных подграфов в <tex>H</tex>. Количество вершин в таких подграфах и степень полинома меньше либо равно <tex>n</tex>. | ||
=== Интеллектуальный анализ невекторных (в частности, графовых) данных === | === Интеллектуальный анализ невекторных (в частности, графовых) данных === | ||
Строка 99: | Строка 100: | ||
=== Трансдуктивное обучение === | === Трансдуктивное обучение === | ||
- | === | + | === Визуализация химического пространства === |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
== Учебные материалы == | == Учебные материалы == |
Текущая версия
Баскин Игорь Иосифович
д.ф.-м.н.
Ведущий научный сотрудник Химического факультета МГУ им. М. В. Ломоносова
Приглашенный профессор лаборатории хемоинформатики Страсбургского университета (Франция)
Действительный член Международной академии математической химии, Американского химического общества и Международного общества хемоинформатики и QSAR
Сфера научных интересов
Хемоинформатика, применение методов машинного обучения и интеллектуального анализа данных в химии.
- Нейронные сети
- Интеллектуальный анализ химических данных
- Визуализация химического пространства
- Ядерные методы машинного обучения в применении к объектам, описываемым непрерывными функциями
- Метод опорных векторов
- Метод генеративных топологических карт (GTM)
- Многозадачное обучение, индуктивный перенос знаний
- Одноклассовая классификация
- Трансдуктивные методы обучения
Избранные публикации (из > 300)
Главы в монографиях
- Baskin I.I., Palyulin V.A., Zefirov N.S. Chapter 8. Neural Networks in Building QSAR Models // Artificial Neural Networks: Methods and Protocols / Livingstone D.S., Ed. . — Humana Press, a part of Springer Science + Business Media, 2008. — С. 139—160.
- Baskin I.I., Varnek A. Chapter 1. Fragment Descriptors in SAR/QSAR/QSPR Studies, Molecular Similarity Analysis and in Virtual Screening // In: Chemoinformatics Approaches to Virtual Screening / Varnek A., Tropsha A., Ed. — RCS Publishing, 2008. — P. 1-43
Обзорные статьи в журналах
- Баскин И. И., Палюлин В. А., Зефиров Н. С. Применение искусственных нейронных сетей в химических и биохимических исследованиях // Вестник Московского университета. Серия 2. Химия. 1999, Т. 40, № 5, С. 323—326
- Гальберштам Н. М., Баскин И. И., Палюлин В. А., Зефиров Н. С. Нейронные сети как метод поиска зависимостей структура — свойство органических соединений // Успехи химии, 2003, Т. 72, № 7, 706—727
- Баскин И. И., Палюлин В. А., Зефиров Н. С. Применение искусственных нейронных сетей для прогнозирования свойств химических соединений // Нейрокомпьютер. 2005. № 1-2. С. 98-101
- Баскин И. И., Палюлин В. А., Зефиров Н. С. Многослойные персептроны в исследовании зависимостей «структура-свойство» для органических соединений // Российский химический журнал (Журнал Российского химического общества им. Д. И. Менделеева), 2006, Т. 50, С. 86-96
- Baskin I., Varnek A. Building a chemical space based on fragment descriptors // Combinatorial Chemistry & High Throughput Screening, 2008, V. 11, No. 8, P. 661—668
- Varnek A., Baskin I. I. Chemoinformatics as a Theoretical Chemistry Discipline // Molecular Informatics, 2011, V. 30, No. 1, P. 20-32.
- Varnek A., Baskin I. Machine Learning Methods for Property Prediction in Chemoinformatics: Quo Vadis? // Journal of Chemical Information and Modeling, 2012, V. 52, No. 6, P. 1413-1437.
Оригинальные статьи в журналах
- Баскин И. И., Палюлин В. А., Зефиров Н. С. Вычислительные нейронные сети как альтернатива линейному регрессионному анализу при изучении количественных соотношений «структура-свойство» на примере физико-химических свойств углеводородов // Докл. РАН, 1993, Т.332, № 6, С. 713—716
- Баскин И. И., Палюлин В. А., Зефиров Н. С. Методология поиска прямых корреляций между структурами и свойствами органических соединений при помощи вычислительных нейронных сетей // Докл. РАН, 1993, Т.333, № 2, С. 176—179
- Baskin I.I., Skvortsova M.I., Palyulin V.A., Zefirov N.S. Quantitative chemical structure — property/activity relationship studies using artificial neural networks // Foundations of Computing and Decision Sciences. 1997. — V.22, No.2. — P.107-116
- Баскин И. И., Гальберштам Н. М., Палюлин В. А., Зефиров Н. С. Компьютерная реализация искусственных нейронных сетей для решения задач по выявлению связи «структура-свойство» // Информационные технологии, 1997, № 9, C. 27-30
- Баскин И. И., Палюлин В. А., Зефиров Н. С. Нейроматематика — будущее вычислительной химии // Нейрокомпьютер, 1997, № 3-4, С. 17-23
- Baskin, I.I.; Halberstam, N.M.; Mukhina, T.V.; Palyulin, V.A.; Zefirov, N.S. The Learned Symmetry Concept in Revealing Quantitative Structure-Activity Relationships with Artificial Neural Networks // SAR and QSAR in Env. Res. — 2001. — V.12. — P. 401—416
- Артеменко Н. В., Баскин И. И., Палюлин В. А., Зефиров Н. С. Прогнозирование физических свойств органических соединений при помощи искусственных нейронных сетей в рамках подструктурного подхода // Докл. РАН, 2001, Т.381, № 2, С. 203—206
- Baskin I.I., Ait A.O., Halberstam N.M., Palyulin V.A., Zefirov N.S. An approach to the interpretation of backpropagation neural network models in QSAR studies // SAR and QSAR in Env. Res. — 2002. — V.13, No.1. — P.35-41
- Halberstam N.M., Baskin I.I., Palyulin V.A., Zefurov N.S. Quantitative Structure -Conditions — Property Relationships Studies. Neural Network Modelling of Acid Hydrolysis of Esters // Mendeleev Communications, 2002, Vol.1, No.6, P.185-186
- Гальберштам Н. М., Баскин И. И., Палюлин В. А., Зефиров Н. С. Построение нейросетевых зависимостей структура-условия-свойство. Моделирование физико-химических свойств углеводородов // Докл. РАН, 2002, Т. 384, № 2, С. 202—205
- Артеменко Н. В., Баскин И. И., Палюлин В. А., Зефиров Н. С. Искусственные нейронные сети и фрагментный подход в прогнозировании физико-химических свойств органических соединений // Известия РАН, Серия химическая. 2003. № 1. С.19-28
- Varnek A., Gaudin C., Marcou G., Baskin I., Pandey A.K., Tetko I.V. Inductive Transfer of Knowledge: Application of Multi-Task Learning and Feature Net Approaches to Model Tissue-Air Partition Coefficients // J. Chem. Inf. Model., 2009, V. 49, № 1, P. 133—144
- Баскин И. И., Жохова Н. И., Палюлин В. А., Зефиров А. Н., Зефиров Н. С. Многоуровневый подход к прогнозированию свойств органических соединений в рамках методологии исследования количественных соотношений «структура-свойство/структура-активность» // Докл. РАН, 2009, Т. 427, № 3, С. 335—339
- Кондратович Е. П., Жохова Н. И., Баскин И. И., Палюлин В. А., Зефиров Н. С. Фрагментные дескрипторы при исследовании соотношений структура-активность: применение для прогнозирования принадлежности органических соединений к фармакологическим группам с использованием метода опорных векторов // Известия Академии наук. Серия химическая, 2009, № 4, С. 641—647.
- Baskin I.I., Kireeva N., Varnek A. The One‐Class Classification Approach to Data Description and to Models Applicability Domain // Molecular Informatics, 2010, V. 29, No. 8‐9, P. 581-587.
- Kireeva N., Baskin I. I., Gaspar H. A., Horvath D., Marcou G., Varnek A. Generative Topographic Mapping (GTM): Universal Tool for Data Visualization, Structure‐Activity Modeling and Dataset Comparison // Molecular Informatics, 2012, V. 31, No. 3‐4, P. 301-312.
Статьи в сборниках
- Baskin I.I., Palyulin V.A., Zefirov N.S. NASA. A computer program for performing QSAR/QSPR studies using artificial neural networks. // QSAR and Molecular Modelling: Concepts, Computational Tools and Biological Applications, Barcelona: Prous Science Publishers, 1995, P. 30-31
- Zefirov N.S., Baskin I.I., Halberstam N.M., Palyulin V.A. Artificial Neural Networks Oriented for the Chemical Structure-Property Relationship Modelling // EUFIT’97 5th European Congress on Intelligent Techniques & Soft Computing. Book of Abstracts. — 1997. — V.1. — P.552-556
- Баскин И. И., Палюлин В. А., Зефиров Н. С. Применение искусственных нейронных сетей в химических и биохимических исследованиях // V Всероссийская конференция «Нейрокомпьютеры и их применение». Москва, 17-19 февраля 1999 г. Сборник докладов, С. 28-31
- Baskin I.I., Keshtova S.V., Palyulin V.A., Zefirov N.S. Combining Molecular Modelling with the Use of Artificial Neural Networks as an Approach to Predict Substituent Constants and Bioactivity // Molecular Modeling and Prediction of Bioactivity; K. Gundertofte; F.S. Jorgensen, Eds.; Klumer Academic / Plenum Publishers: New York, Boston, Dordrecht, London, Moscow, 2000, P. 468—469
- Гальберштам Н. М., Баскин И. И., Палюлин В. А., Зефиров Н. С. Прогнозирование констант скоростей реакций кислотного гидролиза сложных эфиров с использованием искусственных нейронных сетей // Труды VII Всероссийской конференции «Нейрокомпьютеры и их применение». НКП-2001 с международным участием. — 2001. — С.423-424
- Баскин И. И., Палюлин В. А., Зефиров Н. С. Нейрокомпьютеры и геном человека // Труды VII Всероссийской конференции «Нейрокомпьютеры и их применение». НКП-2001 с международным участием. Москва, 14-16 февраля 2001 г., C. 13-16
- Баскин И. И., Гальберштам Н. М., Палюлин В. А., Зефиров Н. С. NASAWIN — программный комплекс для изучения соотношений структура-свойство в химии // Труды VII Всероссийской конференции «Нейрокомпьютеры и их применение». НКП-2001 с международным участием. — 2001. — С.419-422
- Артеменко Н. В., Баскин И. И., Гальберштам Н. М., Палюлин В. А., Зефиров Н. С. Прогнозирование физических свойств органических соединений при помощи нейронных сетей в рамках подструктурного подхода // Труды VII Всероссийской конференции «Нейрокомпьютеры и их применение» НКП-2001 с международным участием. Москва, 2001, С. 414—418
- Айт А. О., Баскин И. И., Гальберштам Н. М. Прогнозирование физико-химических свойств симметричных цианиновых красителей с использованием методологии искусственных нейронных сетей // Труды VII Всероссийской конференции «Нейрокомпьютеры и их применение». НКП-2001 с международным участием. — 2001. — С.411-413
- Baskin I.I., Halberstam N.M., Artemenko N.V., Palyulin V.A., Zefirov N.S. NASAWIN — a universal software for QSPR/QSAR studies // EuroQSAR 2002 Designing Drugs and Crop Protectants: processes, problems and solutions / Eds., M.Ford et al: Blackwell Publishing, 2003, P.260-263.
Проекты
Обратная задача в проблеме «структура-свойство»
В 1989 г. нами впервые была сформулирована т. н. обратная задача в проблеме «структура-свойство», суть которой заключается в поиске структур химических соединений, обладающих свойствами, лежащими в пределах заранее заданных интервалов [1]. Эта задача была нами решена для некоторых примеров путем ее сведения к комбинаторной задаче из области дискретной математики по перечислению графов, значения определенных инвариантов которых лежат в заданных интервалах [2][3][4] (см. обзор[5]). С тех пор понятие об обратной задаче в проблеме «структура-свойство» прочно вошло в область хемоинформатики, а первая наша статья на эту тему на английском языке до сих пор является самой цитируемой из моих публикаций[6].
В настоящий момент мною идет переосмысление этой задачи и в дальнейшем планируется ее переформулировать как задачу построения генеративных статистических моделей, позволяющих по заданному набору свойств найти условное статистическое распределение графов, процедуру сэмплинга из которого можно рассматривать как стохастический генератор химических структур, обладающих заранее заданным набором свойств. До самого последнего времени построение подобных моделей не представлялось реальным ввиду практически полной неразвитости математического аппарата построения генеративных статистических моделей графов, однако за последние несколько лет был опубликован ряд важных работ в этом направлении, которые позволяют взглянуть на эту область с определенным оптимизмом.
Теоремы о базисе инвариантов графов и ее значение для прогнозирования свойств органических соединений
В середине 90-ых годов нами были сформулированы и доказаны две теоремы о базисе инвариантов графов.
Теорема 1. Любой инвариант помеченного графа может быть единственным образом представлен в виде:
где: - множество всех возможных помеченных графов с максимальным числом вершин ; – некоторые константы, не зависящие от и зависящие от ; – число вложений графа в граф (т.е. количество различных подграфов графа , изоморфных ). Таким образом, множество образует базис в алгебре инвариантов графов из множества . Суммирование ведется по подграфам , получаемым из путем удаления ребер всеми неэквивалентными способами.
Теорема 2. Любой инвариант помеченного графа может быть представлен в виде полинома от переменных, равных числам встречаемости некоторых связных подграфов в . Количество вершин в таких подграфах и степень полинома меньше либо равно .
Интеллектуальный анализ невекторных (в частности, графовых) данных
Многозадачное обучение
Одноклассовая классификация
Обучение на основе концепции непрерывных полей
Аддитивное индуктивное обучение
Трансдуктивное обучение
Визуализация химического пространства
Учебные материалы
Ссылки
- ↑ Баскин И. И., Гордеева Е. В., Девдариани Р. О., Зефиров Н. С., Палюлин В. А., Станкевич М. И., «Методология решения обратной задачи в проблеме связи „структура-свойство“ для случая топологических индексов» // ДАН СССР, 1989, Т. 307, № 3, С. 613—616
- ↑ Скворцова М. И., Баскин И. И., Палюлин В. А., Словохотова О. Л., Зефиров Н. С., «Обратная задача в QSAR/QSPR-анализе для случая топологических индексов, характеризующих молекулярную форму (индексов Кира) // ДАН, 1992, т.324, № 2, С. 344—348»
- ↑ Скворцова М.И., Баскин И.И., Палюлин В.А., Словохотова О.Л., Зефиров Н.С., "Обратная задача в проблеме свя-зи структура-свойство для случая корреляционного уравнения, содержащего произвольные топологические дескрипторы" // Докл. РАН, 1996, Т. 346, № 4, С. 497-500
- ↑ Скворцова М.И., Словохотова О.Л., Баскин И.И., Палюлин В.А., Зефиров Н.С., "Обратная задача в проблеме связи структура-свойство для случая информационных топологических индексов" // Докл. РАН, ДАН, 1997, Т. 357, №1, С. 72-74.
- ↑ Skvorsova M.I., Baskin I.I., Palyulin V.A., Slovokhotova O.L., Zefirov N.S., "Structural design. Inverse problems for topological indices in QSAR/QSPR studies" // AIP Conf. Proc. 330. E.C.C.C.1 Comput. Chem. F.E.C.S. Conf., Nancy, France / Ed. by Bernardi F., Rivail J.-L. - Woodbury, N.Y.: AIP Press, 1995, P. 486-499
- ↑ Skvortsova M.I., Baskin I.I., Slovokhotova O.L., Palyulin V.A., Zefirov N.S., "The Inverse Problem in QSAR/QSPR Studies for the Case of Topological Indices Characterizing Molecular Shape (Kier Indices)" // J. Chem. Inf. Comput. Sci., 1993, V. 33, No. 4, P. 630-634