Как видно из рисунка 9, помимо структурных формул доступных анало-
гов, исследователю предоставляются: идентификатор структуры (ID) в базе
данных ChemNavigator, молекулярный вес (MW), расчетное значение лога-
рифма коэффициента распределения октанол-вода (cLogP), а также принад-
лежность к конкретной библиотеке (Collection), показатель чистоты (Purity)
и (в некоторых случаях) ориентировочный срок поставки образца (Shipping
Window).
Оценка величины сходства в простейшем случае осуществляется на ос-
нове так называемого коэффициента Танимото (TC). Для двух структурных
формул А и B коэффициент Танимото может быть рассчитан по формуле:
где:
c
– число совпадающих структурных элементов у анализируемых моле-
кул;
a
– число структурных элементов у молекулы A;
b
– число структурных
элементов у молекулы B.
В качестве структурных элементов могут использоваться различные
дескрипторы, например, фрагменты. При расчете сходства удобным пред-
ставлением структуры является битовая строка, в которой «1» означает
наличие соответствующего дескриптора в молекуле, «0» – его отсутствие.
Значения коэффициента Танимото находятся в интервале между нулем и
единицей, либо могут быть выражены в процентах. Необходимо подчер-
кнуть, что в некоторых случаях величина TC=100% не гарантирует иден-
тичности структурных формул сравниваемых молекул – возможно, что
совпадающие структурные элементы по-разному объединены в структуре
молекул A и B.
Можно предполагать, что в случае химических соединений, имеющих
достаточно сложную структуру, оценки активности/свойства химического
соединения на основе структурного сходства молекул будут менее точными,
чем на основе (Q)SAR зависимостей или моделей фармакофоров, посколь-
ку специфическое взаимодействие лиганда с рецептором обеспечивается
отдельными структурными элементами лиганда, а структурное сходство
рассчитывают для всей молекулы целиком. В работе [406] на основе анали-
за нескольких выборок фармакологических веществ из библиотеки фирмы
Abbott было показано, что при значении TC>85% лишь в 30% случаев моле-
кулы, действительно, обладают сходными свойствами.
Тем не менее, во многих случаях поиск аналогов по сходству является
«методом выбора» при поиске новых фармакологических веществ, посколь-
ку, в особенности для представляющих особый интерес новых молекуляр-
ных мишеней, количество известных лигандов на ранних стадиях исследо-
ваний составляет от одной до нескольких молекул, что недостаточно для
построения (Q)SAR зависимостей или моделей фармакофоров.
Достарыңызбен бөлісу: