Определение спектра биологической активности с помощью программы PASS C&T (Prediction of Activity Spectra for Substances: Complex & Training)
Дипломы, курсовые и прочее / Создание новых лекарственных веществ / Дипломы, курсовые и прочее / Создание новых лекарственных веществ / Определение спектра биологической активности с помощью программы PASS C&T (Prediction of Activity Spectra for Substances: Complex & Training) Определение спектра биологической активности с помощью программы PASS C&T (Prediction of Activity Spectra for Substances: Complex & Training)
Страница 1

Современная версия компьютерной системы предсказания спектра биологической активности PASS C&T

(P

rediction of A

ctivity S

pectra for S

ubstances: C

omplex & T

raining) реализована в 1998 году. Она включает в себя обучающую выборку, содержащую более 45000 биологически активных веществ с известной биологической активностью, и охватывает более 400 фармакологических эффектов, механизмов действия, а также мутагенность, канцерогенность, тератогенность и эмбриотоксичность.

Работа PASS основана на анализе зависимостей «структура-активность» для веществ из обучающей выборки, содержащей более 45000 разнообразных биологически активных веществ (субстанции известных лекарственных препаратов и фармакологически активные соединения). Обучающая выборка постоянно пополняется новой информацией о биологически активных веществах, отбираемой как из публикаций в научно-технической литературе, так и из многочисленных баз данных. Химическая структура представлена в PASS в виде оригинальных MNA дескрипторов (Mulilevel Neighbourhoods of Atoms). MNA дескрипторы имеют универсальный характер и с достаточно хорошей точностью описывают разнообразные зависимости «структура-свойство». Используемый в PASS математический алгоритм был отобран путем целенаправленного анализа и сравнения эффективности для решения подобных задач большого числа различных методов. Показано, что данный алгоритм обеспечивает получение устойчивых в статистическом смысле зависимостей “структура-активность” и, соответственно, результатов прогноза. Это очень важно, поскольку включенные в обучающую выборку данные всегда обладают определенной неполнотой как в отношении охвата всех химических классов веществ, имеющих конкретный вид активности, так и в отношении изученности каждого отдельного вещества на все возможные виды активности. Средняя точность прогноза при скользящем контроле составляет свыше 85%. Скользящий контроль проводится следующим образом: из обучающей выборки поочередно удаляется одно вещество и для него делается прогноз на основе анализа оставшейся части обучающей выборки, результат сравнивается с известными экспериментальными данными. Процедура повторяется итеракивно для каждого из веществ и рассчитывается средняя точность прогноза. Точность прогноза в 85% достаточна для практического применения системы PASS с целью прогноза спектра биологической активности новых веществ, поскольку ожидаемая вероятность случайного угадывания одного из 780 видов активности составляет около 0.1% [10].

Результаты прогноза выдаются пользователю в виде списка названий вероятных видов активности с расчетными оценками вероятностей наличия (Pa) и отсутствия каждого вида активности (Pi), которые имеют значения от 0 до 1. Эти вероятности рассчитываются независимо по подвыборкам активных и неактивных соединений, и поэтому их сумма не равна единице. Pa и Pi интерпретируются как оценки меры принадлежности вещества к классам активных и неактивных соединений соответственно, либо как оценки ошибок первого и второго рода. Чем больше для конкретной активности величина Pa и чем меньше величина Pi, тем больше шанс обнаружить данную активность в эксперименте. Если при анализе прогнозируемого списка активностей для исследования выбираются те виды активности, для которых Pa>90%, то мы рискуем пропустить около 90% действительно активных соединений, но вероятность ложноположительных прогнозов при этом ничтожно мала; для Pa>80% - пропустим уже только 80% активных соединений, но и вероятность ложноположительных прогнозов будет выше, наконец, для Pa>Pi вероятности ошибок первого и второго рода равны [1, 9, 10].

На практике, однако, при отборе для исследования наиболее перспективных веществ руководствуются и другими критериями, например, критерием новизны. При этом исходят из того, что чем ближе значение Pa к единице, тем более вероятно, что вещество является близким аналогом известного препарата. Поэтому, если целью исследователя является выявление соединений с достаточно высоким уровнем новизны (New Chemical Entity, NCE), то надо выбирать вещества, для которых величина прогнозируемой вероятности Pa для требуемого вида активности несколько ниже, например, 0,5<PA< NCE.

Базируясь на данных компьютерного прогноза, исследователь может:

· определить, какие тесты наиболее адекватны для изучения биологической активности конкретного химического соединения.

· обнаружить новые эффекты и механизмы действия для ранее изученных веществ;

· отобрать наиболее вероятные базовые структуры новых лекарств с требуемым биологическим действием среди доступных для скрининга химических соединений.

Страницы: 1 2

Смотрите также

Моделирование парожидкостного равновесия
Выбор модели, адекватно описывающей фазовое равновесие системы, является важным и необходимым шагом при решении массообменного процесса. На сегодняшний день разработано достаточно большое число мет ...

Анализ индивидуального риска событий узла пиролиза этановой фракции
...

Увеличение степени защиты стали от коррозии в нейтральных и кислых средах
Работа посвящена проблеме увеличения степени защиты стали от коррозии в нейтральных и кислых средах, при использовании фосфорсодержащих ингибиторов, а также совершенствованию дискретных мет ...