Google DeepMind представила Tx-LLM, новую большую языковую модель (LLM) искусственного интеллекта (ИИ), специально разработанную для прогнозирования свойств биологических объектов на протяжении всего процесса разработки лекарств. Эта модель, построенная на базе языковой модели PaLM-2, обучена на 66 наборах данных, охватывающих этапы от ранней идентификации генов-мишеней до утверждения клинических испытаний на поздних стадиях.
Tx-LLM демонстрирует потенциал для значительного ускорения процесса разработки лекарств, сокращения времени и затрат, необходимых для вывода новых препаратов на рынок.
Ключевые особенности Tx-LLM:
- Обучение на обширной базе данных: Tx-LLM обучена на коллекции Therapeutics Instruction Tuning (TxT), включающей 709 наборов данных, охватывающих 66 задач, связанных с разработкой лекарственных средств. TxT использует данные из Therapeutic Data Commons (TDC) и представляет их в формате инструкций-ответов, подходящем для обучения LLM.
- Многофункциональность: Модель способна предсказывать свойства различных биологических объектов, включая малые молекулы, белки, нуклеиновые кислоты, клеточные линии и заболевания.
- Высокая эффективность: Tx-LLM показала впечатляющие результаты, превзойдя современные специализированные модели в 22 из 66 задач и показав конкурентоспособные результаты в 43 задачах.
- Эффективное сочетание данных: Модель особенно эффективна в задачах, сочетающих информацию о малых молекулах с текстовыми данными, например, прогнозирование одобрения препарата в клинических испытаниях на основе его названия и названия заболевания.
Преимущества Tx-LLM для фармацевтической отрасли:
- Ускорение процесса открытия лекарств: Tx-LLM способна быстро и эффективно предсказывать свойства потенциальных лекарственных соединений, что может значительно сократить время, затрачиваемое на разработку новых препаратов.
- Снижение затрат: Использование ИИ для прогнозирования свойств лекарств может уменьшить потребность в дорогостоящих экспериментах, что приведет к снижению общих затрат на разработку.
- Повышение эффективности клинических испытаний: Tx-LLM может помочь в оптимизации дизайна клинических испытаний, выборе наиболее перспективных кандидатов на лекарственные средства и повышении точности прогнозирования результатов.
Google DeepMind изучает возможности предоставления доступа к Tx-LLM внешним исследователям. Команда заинтересована в обратной связи от потенциальных пользователей, чтобы лучше понять их потребности и задачи.
Важно отметить, что Tx-LLM все еще находится на стадии разработки, и ее возможности нуждаются в дальнейшей оценке и совершенствовании. В частности, модель пока не способна объяснять свои прогнозы пользователю, что является важным аспектом для принятия решений в фармацевтике.