лишь краткую информацию, необходимую для интерпретации результатов
прогноза, и некоторые примеры использования PASS для поиска новых
фармакологических веществ.
На рис. 13 показан результат прогноза спектра биологической активно-
сти
для препарата Клопидогрел, обладающего антиагрегантным действи-
ем. Прогнозируемый спектр биологической активности представлен в виде
списка вероятных видов биологической активности; при этом для каждой
активности приведены оценки двух вероятностей Pa – вероятность наличия
активности и Pi – вероятность отсутствия активности. Как видно из приве-
денных на рисунке данных, для антиагрегантного (antithrombotic) действия
Pa=0, 859, а Pi=0, 003. Для активности ингибитор агрегации тромбоцитов
(Platelet aggregation inhibitor) эти вероятности равны 0, 647 и 0, 005, соот-
ветственно.
Как видно из рисунка 13, в PASS имеется возможность оценить вклад
конкретных атомов в вероятность наличия определенной активности: для
ингибирования агрегации тромбоцитов отдельные
атомы в структурной
формуле Клопидогрела раскрашены разными цветами. Здесь: зеленый
означает положительный; красный – отрицательный; синий или серый –
нейтральный вклады в анализируемую активность. Эта информация мо-
жет быть использована химиками при дизайне
аналогов с повышенной
вероятностью наличия активности (в случае побочного действия или ток-
сичности – с пониженной вероятностью наличия активности).
Рис. 13.
Прогноз спектра биологической активности для препарата Клопидогрел с исполь-
зованием PASS 2019
Глава 2. Прогнозирование свойств фармакологических веществ in silico
73
Важный вопрос связан с выбором порогов вероятностей для отбора «ак-
тивных» соединений. Зависимости, необходимые для получения вероятно-
стей Pa и Pi по значениям B статистики (подробнее о методе расчета см. в
работе [283]), и оценки точности прогноза
PASS являются конечным ре-
зультатом процедуры обучения, которая состоит в следующем. По данным
SAR Base, сформированной на основе обучающей выборки,
для каждой
активности A
k
для каждого из N
k
активных и для каждого из N-N
k
неактив-
ных соединений вычисляются значения B статистики. Вычисления прово-
дятся в режиме скользящего контроля с исключением по одному, т.е. после
«исключения» этого соединения из SAR Base. По полученным выборкам
B статистики строятся гладкие полиномиальные оценки функций Pa(B) и
Pi(B). На рис. 14 представлены распределения Pa(B) и Pi(B) для активности
«Антигипертензивное».
Ри. 14.
Зависимости
Pa
(
B
) и
Pi
(
B
) для активности «Антигипертензивное» на основе данных,
представленных в базе знаний PASS
Из приведенного на рисунке 14 примера видно, что значения
Pi
моно-
тонно убывают при возрастании значений
Pa
и сумма
Pa
и
Pi
меньше или
равна 1. Вероятности
Pa
и
Pi
являются также, по построению, оценками ве-
роятности ошибок прогноза 1-го и 2-го рода, соответственно, а 1-
Pa
и 1-
Pi
–
оценками чувствительности и специфичности. Вероятности
Pa
и
Pi
можно
рассматривать и как меры принадлежности прогнозируемого соединения к
нечетким множествам «активных» и «неактивных» органических соедине-
ний. Все эти интерпретации вероятностей
Pa
и
Pi
эквивалентны и полезны
для анализа результатов прогноза. На их основе можно сконструировать са-
мые разные критерии анализа результатов прогноза, соответствующие ре-
шению конкретных практических задач.
74
Достарыңызбен бөлісу: