Определение спектра биологической активности с помощью программы PASS C&T (Prediction of Activity Spectra for Substances: Complex & Training)
Дипломы, курсовые и прочее / Создание новых лекарственных веществ / Дипломы, курсовые и прочее / Создание новых лекарственных веществ / Определение спектра биологической активности с помощью программы PASS C&T (Prediction of Activity Spectra for Substances: Complex & Training) Определение спектра биологической активности с помощью программы PASS C&T (Prediction of Activity Spectra for Substances: Complex & Training)
Страница 1

Современная версия компьютерной системы предсказания спектра биологической активности PASS C&T

(P

rediction of A

ctivity S

pectra for S

ubstances: C

omplex & T

raining) реализована в 1998 году. Она включает в себя обучающую выборку, содержащую более 45000 биологически активных веществ с известной биологической активностью, и охватывает более 400 фармакологических эффектов, механизмов действия, а также мутагенность, канцерогенность, тератогенность и эмбриотоксичность.

Работа PASS основана на анализе зависимостей «структура-активность» для веществ из обучающей выборки, содержащей более 45000 разнообразных биологически активных веществ (субстанции известных лекарственных препаратов и фармакологически активные соединения). Обучающая выборка постоянно пополняется новой информацией о биологически активных веществах, отбираемой как из публикаций в научно-технической литературе, так и из многочисленных баз данных. Химическая структура представлена в PASS в виде оригинальных MNA дескрипторов (Mulilevel Neighbourhoods of Atoms). MNA дескрипторы имеют универсальный характер и с достаточно хорошей точностью описывают разнообразные зависимости «структура-свойство». Используемый в PASS математический алгоритм был отобран путем целенаправленного анализа и сравнения эффективности для решения подобных задач большого числа различных методов. Показано, что данный алгоритм обеспечивает получение устойчивых в статистическом смысле зависимостей “структура-активность” и, соответственно, результатов прогноза. Это очень важно, поскольку включенные в обучающую выборку данные всегда обладают определенной неполнотой как в отношении охвата всех химических классов веществ, имеющих конкретный вид активности, так и в отношении изученности каждого отдельного вещества на все возможные виды активности. Средняя точность прогноза при скользящем контроле составляет свыше 85%. Скользящий контроль проводится следующим образом: из обучающей выборки поочередно удаляется одно вещество и для него делается прогноз на основе анализа оставшейся части обучающей выборки, результат сравнивается с известными экспериментальными данными. Процедура повторяется итеракивно для каждого из веществ и рассчитывается средняя точность прогноза. Точность прогноза в 85% достаточна для практического применения системы PASS с целью прогноза спектра биологической активности новых веществ, поскольку ожидаемая вероятность случайного угадывания одного из 780 видов активности составляет около 0.1% [10].

Результаты прогноза выдаются пользователю в виде списка названий вероятных видов активности с расчетными оценками вероятностей наличия (Pa) и отсутствия каждого вида активности (Pi), которые имеют значения от 0 до 1. Эти вероятности рассчитываются независимо по подвыборкам активных и неактивных соединений, и поэтому их сумма не равна единице. Pa и Pi интерпретируются как оценки меры принадлежности вещества к классам активных и неактивных соединений соответственно, либо как оценки ошибок первого и второго рода. Чем больше для конкретной активности величина Pa и чем меньше величина Pi, тем больше шанс обнаружить данную активность в эксперименте. Если при анализе прогнозируемого списка активностей для исследования выбираются те виды активности, для которых Pa>90%, то мы рискуем пропустить около 90% действительно активных соединений, но вероятность ложноположительных прогнозов при этом ничтожно мала; для Pa>80% - пропустим уже только 80% активных соединений, но и вероятность ложноположительных прогнозов будет выше, наконец, для Pa>Pi вероятности ошибок первого и второго рода равны [1, 9, 10].

На практике, однако, при отборе для исследования наиболее перспективных веществ руководствуются и другими критериями, например, критерием новизны. При этом исходят из того, что чем ближе значение Pa к единице, тем более вероятно, что вещество является близким аналогом известного препарата. Поэтому, если целью исследователя является выявление соединений с достаточно высоким уровнем новизны (New Chemical Entity, NCE), то надо выбирать вещества, для которых величина прогнозируемой вероятности Pa для требуемого вида активности несколько ниже, например, 0,5<PA< NCE.

Базируясь на данных компьютерного прогноза, исследователь может:

· определить, какие тесты наиболее адекватны для изучения биологической активности конкретного химического соединения.

· обнаружить новые эффекты и механизмы действия для ранее изученных веществ;

· отобрать наиболее вероятные базовые структуры новых лекарств с требуемым биологическим действием среди доступных для скрининга химических соединений.

Страницы: 1 2

Смотрите также

Активация малых молекул
В катализе часто применяют термин “активация”, понимая при этом повышение реакционной способности реагентов. Попытаемся наполнить этот термин конкретным физическим содержанием. Под активацие ...

Разработка школьного элективного курса "Полимеры вокруг нас"
...

Нитросоединения
...