Создание моделей искусственного интеллекта, понимающих химические принципы.
Коннор Коли работает на стыке химии и машинного обучения, занимаясь открытием и разработкой новых лекарственных соединений.
«MIT — это совершенно особенное место с точки зрения ресурсов и взаимодействия между различными факультетами», — говорит Коннор Коли. Фото: Гретхен Эртл
По оценкам, среди всех возможных химических соединений от 1020 до 1060 могут обладать потенциалом в качестве низкомолекулярных лекарственных препаратов.
Экспериментальная оценка каждого из этих соединений заняла бы слишком много времени у химиков. Поэтому в последние годы исследователи начали использовать искусственный интеллект для выявления соединений, которые могли бы стать перспективными кандидатами в лекарственные препараты.
Одним из таких исследователей является доцент Массачусетского технологического института Коннор Коли, доктор философии (выпуск 2019 года), профессор кафедры развития карьеры, занимающий должности на кафедрах химической инженерии, электротехники и информатики, а также в Высшем колледже вычислительной техники им. Шварцмана при Массачусетском технологическом институте. Его исследования находятся на стыке химической инженерии и информатики, поскольку он разрабатывает и использует вычислительные модели для анализа огромного количества возможных химических соединений, проектирования новых соединений и прогнозирования путей реакций, которые могли бы привести к образованию этих соединений.
«Это очень общий подход, который можно применять к любым задачам, связанным с органическими молекулами, но в первую очередь мы рассматриваем разработку лекарств на основе малых молекул», — говорит он.
Пересечение искусственного интеллекта и науки
Интерес Коли к науке передался ему по наследству. По его словам, в его семье больше ученых, чем людей, не имеющих отношения к науке, включая его отца, врача-радиолога; его мать, получившую степень в области молекулярной биофизики и биохимии, прежде чем поступить в Школу менеджмента Слоуна при Массачусетском технологическом институте; и его бабушку, профессора математики.
Будучи школьником в Дублине, штат Огайо, Коли участвовал в научных олимпиадах и окончил школу в 16 лет. Затем он поступил в Калифорнийский технологический институт, где выбрал химическую инженерию в качестве специальности, поскольку это позволяло объединить его интересы в науке и математике.
В студенческие годы он также интересовался информатикой, работая в лаборатории структурной биологии и используя язык программирования Fortran для решения задач по определению кристаллической структуры белков. После окончания Калифорнийского технологического института он решил продолжить обучение в области химической инженерии и в 2014 году поступил в Массачусетский технологический институт, чтобы начать работу над докторской диссертацией.
Под руководством профессоров Клавса Йенсена и Уильяма Грина Коли работал над способами оптимизации автоматизированных химических реакций. Его работа была сосредоточена на сочетании машинного обучения и хемоинформатики — применения вычислительных методов для анализа химических данных — для планирования реакционных путей, которые могли бы создавать новые молекулы лекарственных препаратов. Он также работал над проектированием оборудования, которое можно было бы использовать для автоматического проведения этих реакций.
Часть этой работы была выполнена в рамках финансируемой DARPA программы Make-It, которая была направлена на использование машинного обучения и анализа данных для улучшения синтеза лекарств и других полезных соединений из простых строительных блоков.
«Это стало моей отправной точкой для размышлений о хемоинформатике, машинном обучении и о том, как мы можем использовать модели для понимания того, как можно получать различные химические вещества и какие реакции возможны», — говорит Коли.
Коли начал подавать заявки на преподавательские должности еще будучи аспирантом и в 25 лет принял предложение от MIT. Он получил множество советов за и против работы в том же университете, где учился в аспирантуре, и в конце концов решил, что должность в MIT слишком заманчива, чтобы от нее отказаться.
«MIT — это совершенно особенное место с точки зрения ресурсов и гибкости взаимодействия между факультетами. MIT, похоже, отлично справляется с поддержкой взаимодействия ИИ и науки, и это была динамичная экосистема, в которой было приятно оставаться», — говорит он. «Уровень студентов, их энтузиазм и невероятная сила сотрудничества определенно перевесили любые потенциальные опасения по поводу пребывания в одном месте».
Химическая интуиция
Коли отложил назначение на должность преподавателя на год, чтобы пройти постдокторантуру в Институте Броуда, где он стремился получить больше опыта в области химической биологии и разработки лекарств. Там он работал над способами идентификации малых молекул из миллиардов кандидатов в ДНК-кодированных библиотеках, которые могли бы связываться с мутированными белками, связанными с заболеваниями.
После возвращения в Массачусетский технологический институт в 2020 году он создал свою исследовательскую группу с целью применения искусственного интеллекта не только для синтеза существующих соединений с терапевтическим потенциалом, но и для разработки новых молекул с желаемыми свойствами и новых способов их получения. За последние несколько лет его лаборатория разработала множество вычислительных подходов для решения этих задач.
«Мы стараемся понять, как лучше всего связать задачу в химии с потенциальным вычислительным решением. И часто именно такое сочетание стимулирует разработку новых методов», — говорит Коли. Одна из моделей, разработанных его лабораторией, известная как ShEPhERD, была обучена оценивать потенциальные новые молекулы лекарств на основе того, как они будут взаимодействовать с целевыми белками, исходя из трехмерной формы молекул лекарств. Эта модель сейчас используется фармацевтическими компаниями для поиска новых лекарств.
«Мы пытаемся придать генеративной модели больше интуиции медицинской химии, чтобы модель учитывала правильные критерии и соображения», — говорит Коли.
В другом проекте лаборатория Коли разработала генеративную модель искусственного интеллекта под названием FlowER, которую можно использовать для прогнозирования продуктов реакции, которые образуются при сочетании различных химических веществ.
При разработке этой модели исследователи учли понимание фундаментальных физических принципов, таких как закон сохранения массы. Они также обязали модель учитывать осуществимость промежуточных этапов, которые должны произойти на пути от реагентов к продуктам. Как выяснили исследователи, эти ограничения повысили точность прогнозов модели.
«Размышления о промежуточных этапах, задействованных механизмах и о том, как развивается реакция, — это то, что химики делают совершенно естественно. Так преподают химию, но модели не задумываются об этом по своей природе», — говорит Коли. «Мы потратили много времени на то, чтобы убедиться, что наши модели машинного обучения основаны на понимании механизмов реакции, так же, как и модели опытного химика».
Студенты в его лаборатории также работают над многими различными областями, связанными с оптимизацией химических реакций, включая компьютерное моделирование структур, автоматизацию лабораторных процессов и оптимальное планирование экспериментов.
«Благодаря этим многочисленным различным направлениям исследований мы надеемся продвинуть границы применения искусственного интеллекта в химии», — говорит Коли.
Источник: news.mit.edu

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.