будущее есть!
  • После
  • Конспект
  • Документ недели
  • Бутовский полигон
  • Колонки
  • Pro Science
  • Все рубрики
    После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша
После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша

Конспекты Полит.ру

Смотреть все
Алексей Макаркин — о выборах 1996 года
Апрель 26, 2024
Николай Эппле — о речи Пашиняна по случаю годовщины геноцида армян
Апрель 26, 2024
«Демография упала» — о демографической политике в России
Апрель 26, 2024
Артем Соколов — о технологическом будущем в военных действиях
Апрель 26, 2024
Анатолий Несмиян — о технологическом будущем в военных действиях
Апрель 26, 2024

После

Смотреть все
«После» для майских
Май 7, 2024

Публичные лекции

Смотреть все
Всеволод Емелин в «Клубе»: мои первые книжки
Апрель 29, 2024
Вернуться к публикациям
МФТИ химия искусственный интеллект фармакология наука исследования
Январь 26, 2024
Pro Science

Поиск новых лекарств и машинное обучение

Поиск новых лекарств и машинное обучение
ps_c1db08a4-6a5f-492b-bdbe-9691fb9166d4
В последние годы компьютерное моделирование сильно облегчило создание новых лекарств за счет предсказания структуры молекул и их взаимодействий. Однако даже такой «чисто компьютерный» скрининг может быть слишком дорог и затруднен, если речь идет о миллионах веществ. Поэтому авторы статьи в Journal of Chemical Information and Modeling — исследователи из Московского физико-технического института, Университетов Гронингена и Гренобля, — сделали этот процесс намного быстрее и эффективнее с помощью активного машинного обучения. О работе рассказал Центр научной коммуникации МФТИ.

Биологические свойства молекул — способность выполнять свои функции и взаимодействовать с другими соединениями — напрямую зависят от структуры. Это касается и белков — рецепторов и ферментов, которые служат мишенью для разных фармакологических препаратов. Недавние успехи в предсказании структуры белковых молекул с помощью искусственного интеллекта открыли новые возможности для дизайна лекарств. Однако не менее важно знать, как белки взаимодействуют с другими соединениями.

Проверять активность многих тысяч лигандов — связывающих белок молекул, — в реальном эксперименте слишком дорого и трудоемко. Поэтому сейчас ученые начинают с виртуального скрининга, то есть компьютерного поиска веществ с нужными свойствами. Например, моделируют взаимодействия будущего лекарства и его мишени с помощью молекулярного докинга (по-английски буквально «стыковка»), то есть поиска оптимального взаиморасположения молекул при контакте. Виртуальный скрининг позволяет оценить биологические эффекты вещества намного быстрее и дешевле. Самые перспективные из молекул-кандидатов далее проверяют в реальном эксперименте, в случае успеха — в доклинических исследованиях на животных и лишь затем — на пациентах.

Однако виртуальный скрининг больших библиотек молекул встречает трудности. В подобных библиотеках обычно десятки миллионов соединений. Понятно, что проверка такого количества требует значительных вычислительных ресурсов. Важно понимать, что «машинное время» (то есть длительность работы процессора) означает денежные расходы. Так, докинг всего одного лиганда занимает несколько секунд работы центрального процессора (CPU). Обработка большой библиотеки из десятков миллионов лигандов с помощью облачных сервисов потребует уже десятков лет работы процессора и будет стоить десятки тысяч долларов. Поэтому ученые пытаются сделать этот процесс быстрее и доступнее.

«В связи с огромным количеством проверяемых веществ виртуальный скрининг занимает много машинного времени, даже если мы используем современные вычислительные ресурсы. Более того, химические пространства потенциальных лекарств постоянно расширяются, что требует увеличения эффективности процесса», — рассказал руководитель исследования Валентин Борщевский, заместитель директора Центра исследований молекулярных механизмов старения и возрастных заболеваний МФТИ.

Авторы нового исследования использовали библиотеки, которые описывают докинг миллиона лигандов для каждого из четырех изученных белков. Это аденозиновый рецептор человека типа A2 (AA2AR), каннабиноидный рецептор 2 типа (CB2), дофаминовый рецептор 4 типа (D4) и бета-лактамаза AmpC — фермент, из-за которого бактерии становятся устойчивыми к антибиотикам. Далее авторы выяснили, какая модель машинного обучения (machine learning, ML) в этом случае подходит для предсказания результатов докинга лучше всего. Ей оказалась линейная регрессия — довольно простой метод, если сравнивать с такими «тяжеловесами» ML, как обычно используемые случайный лес, деревья решений или глубокое обучение.
Затем линейную регрессию использовали в режиме активного обучения. Оно происходило поэтапно: после докинга маленькой порции библиотеки на каждом новом шаге обучали базовую модель, которая выделяла лиганды с максимальными оценками — именно их использовали для докинга на следующем этапе. В итоге скрининг всего 10 % библиотеки по такой схеме выявил от 48 до 91 % лигандов, которые входят в одну сотую часть самых активных. Показатели качества моделей были сравнимы с теми, что получены ранее с помощью гораздо более «сложных» моделей.

«Мы продемонстрировали, что машинное обучение может значительно ускорить поиск перспективных веществ. Оказалось, необязательно оценивать аффинность (то есть сродство молекул, силу связывания) для всех. Достаточно выбрать небольшое количество молекул из списка, оценить их аффинность, обучить на них искусственный интеллект и затем точно предсказывать перспективные вещества из оставшегося списка. Это позволяет значительно ускорить процесс разработки новых лекарств», — подытожил Валентин Борщевский.
читайте также
Pro Science
Эксперименты империи. Адат, шариат и производство знаний в Казахской степи
Май 15, 2024
Pro Science
Раскопки в Телль Ваджеф
Май 15, 2024
ЗАГРУЗИТЬ ЕЩЕ

Бутовский полигон

Смотреть все
Начальник жандармов
Май 6, 2024

Человек дня

Смотреть все
Человек дня: Александр Белявский
Май 6, 2024
Публичные лекции

Лев Рубинштейн в «Клубе»

Pro Science

Мальчики поют для девочек

Колонки

«Год рождения»: обыкновенное чудо

Публичные лекции

Игорь Шумов в «Клубе»: миграция и литература

Pro Science

Инфракрасные полярные сияния на Уране

Страна

«Россия – административно-территориальный монстр» — лекция географа Бориса Родомана

Страна

Сколько субъектов нужно Федерации? Статья Бориса Родомана

Pro Science

Эксперименты империи. Адат, шариат и производство знаний в Казахской степи

О проекте Авторы Биографии
Свидетельство о регистрации средства массовой информации Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством Российской Федерации по делам печати, телерадиовещания и средств массовой информации.

© Полит.ру, 1998–2024.

Политика конфиденциальности
Политика в отношении обработки персональных данных ООО «ПОЛИТ.РУ»

В соответствии с подпунктом 2 статьи 3 Федерального закона от 27 июля 2006 г. № 152-ФЗ «О персональных данных» ООО «ПОЛИТ.РУ» является оператором, т.е. юридическим лицом, самостоятельно организующим и (или) осуществляющим обработку персональных данных, а также определяющим цели обработки персональных данных, состав персональных данных, подлежащих обработке, действия (операции), совершаемые с персональными данными.

ООО «ПОЛИТ.РУ» осуществляет обработку персональных данных и использование cookie-файлов посетителей сайта https://polit.ru/

Мы обеспечиваем конфиденциальность персональных данных и применяем все необходимые организационные и технические меры по их защите.

Мы осуществляем обработку персональных данных с использованием средств автоматизации и без их использования, выполняя требования к автоматизированной и неавтоматизированной обработке персональных данных, предусмотренные Федеральным законом от 27 июля 2006 г. № 152-ФЗ «О персональных данных» и принятыми в соответствии с ним нормативными правовыми актами.

ООО «ПОЛИТ.РУ» не раскрывает третьим лицам и не распространяет персональные данные без согласия субъекта персональных данных (если иное не предусмотрено федеральным законом РФ).