Отраслевой информационный портал

Ученые научили нейросеть «читать» ДНК с «пробелами» для ускорения создания лекарств

Российские исследователи сделали значительный шаг вперед в области генетики и искусственного интеллекта. Ученые из «Сколтеха» (входит в группу ВЭБ.РФ) успешно применили систему генеративного ИИ для разработки алгоритма, способного определять расположение большого количества генов внутри нитей ДНК даже при неполном наборе известных расстояний между ними. Этот инновационный подход обещает значительно ускорить разработку лекарств и методов диагностики генетических заболеваний. Об этом сообщает пресс-служба Сколтеха.

Геном человека и других многоклеточных животных представляет собой сверхдлинные нити ДНК, упакованные в хромосомы внутри ядра клетки. Понимание трехмерной структуры генома, процессов его сворачивания и разворачивания, а также влияния положения генов на их работу – ключевая задача для биологов, физиков и математиков.

«Закрашивание» пробелов в данных с помощью ИИ

Традиционные методы получения сведений о расположении генов, такие как флуоресцентная микроскопия (FISH), сталкиваются с ограничениями. В рамках этой методики лишь часть участков ДНК может быть помечена светящимися метками, что приводит к появлению «пробелов» в данных. Эти пробелы, в свою очередь, мешают полноценному изучению взаимодействий между генами.

Российские исследователи выдвинули гипотезу, что эти пустоты в экспериментальных замерах можно «закрасить» с помощью генеративных систем искусственного интеллекта. Подобно тому, как ИИ дополняет незавершенные работы художников или эскизы, он может восстанавливать недостающую информацию о геноме. «Если узнать расстояния между достаточным количеством пар генов, поиск расстояний между остальными парами, для которых нет экспериментальных данных, принимает вид математической задачи с конкретным решением», — пояснил старший преподаватель «Сколтеха» Кирилл Половников. Он также отметил, что это «нетипичная сфера» для применения генеративных моделей.

Успешное тестирование на хромосоме человека

Для проверки своей идеи ученые обучили несколько популярных генеративных ИИ-моделей, включая DDPM, DDRM и DDNM, «дополнять» неполные экспериментальные данные.

Работу обученной системы ИИ проверили на одном из участков 21-й хромосомы человека, длина которого составляет 2 миллиона «букв»-нуклеотидов. Из этого участка исследователи намеренно удалили часть известных расстояний между генами, чтобы сымитировать «пробелы». Последующие расчеты показали, что алгоритм DDRM успешно восстановил значительную часть утерянных участков. Более того, он превзошел в этом отношении классические методы биоинформатики.

Путь к ускоренной разработке лекарств

Это достижение, как подытожили ученые, позволит использовать новый алгоритм для ускоренного изучения структуры хромосом. Понимание трехмерного устройства ДНК и точного расположения генов является фундаментальным для разработки новых терапий и диагностических инструментов, что открывает перспективы для создания прорывных медицинских решений.

spot_img

Экспертные материалы