(OECD принципы, Organisation for Economic Co-operation and Development)
построения QSAR моделей (OECD (Q)SAR project) [425]:
1. Четко определенное свойство, для которого создается QSAR модель.
2. Однозначный алгоритм построения зависимости «структура-актив-
ность».
3. Определенная область применимости.
4. Четкие критерии оценки надежности
прогноза и предсказательной
способности.
5. Механистическая интерпретация (соответствие реальным механиз-
мам
прогнозируемых взаимодействий, если это возможно).
Применение (Q)SAR моделей в поиске новых фармакологических ве-
ществ основано на том, что фармакологические эффекты конкретного со-
единения, вызываемые его взаимодействием с
молекулярной мишенью,
зависят от особенностей его структуры. Следовательно, описав структуру
соединения набором характерных элементов (молекулярных дескрипторов)
и проанализировав ряд соединений, обладающих
одинаковыми свойства-
ми, на основании схожести их структурной организации можно построить
зависимость, вероятнее всего прогнозирующую проявление конкретного
свойства. Построенная зависимость может быть использована для оценки
наличия величины данного свойства для новых соединений и отбора «кан-
дидатов»,
согласно прогнозу, обладающих данным свойством.
Таким образом, необходимыми элементами при построении (Q)SAR
зависимостей являются дескрипторное описание химической структуры,
представление биологической активности, математический метод для ана-
лиза взаимосвязей «структура-активность», наличие обучающей выборки.
В настоящее время разработано несколько тысяч различных структур-
ных дескрипторов, включая структурные фрагменты, топологические ин-
дексы, различные
физико-химические параметры, квантово-химические
характеристики, и др. [489].
Представление биологической активности
может быть качественным
либо количественным. В первом случае, фиксируется
факт наличия или
отсутствия активности («активно/неактивно», «1/0»), и для анализа взаи-
мосвязей структура-активность используются классификационные модели,
которые позволяют отнести новое соединение к категории «активных» или
«неактивных» с оценкой соответствующих вероятностей. Во втором случае
для оценки величины активности используют количественные параметры,
характеризующие «выраженность» активности, такие как IC
50
, EC
50
, CC
50
,
и др., которые рассматриваются в качестве независимых переменных при
построении количественных зависимостей QSAR, например, с использова-
нием регрессионных моделей.
Для оценки взаимосвязей «структура-активность»
используют самые
разные математические подходы, включая метод ближайших соседей, ис-
кусственные нейронные сети, деревья решений, множественную линейную
регрессию, метод опорных векторов, Байесовскую статистику, глубокое ма-
шинное обучение, и др.
64
Достарыңызбен бөлісу: