Биоинформатики Новосибирского государственного университета, ФИЦ «Институт цитологии и генетики СО РАН» и университета им. Мартина Лютера (Германия) создали уникальный программный комплекс, который позволит повысить эффективность анализа дорогостоящих геномных экспериментов. Результаты работы ученых опубликованы в журнале Nucleic Acids Research.
Как объяснили исследователи, данный комплекс предназначен для поиска в ДНК совместно встречающихся мотивов — участков, на которые «садятся» белки, управляющие считыванием закодированной в молекуле ДНК информации. Расположенные рядом мотивы, как правило, функционируют вместе, поэтому выявление таких пар позволит ученым предсказывать взаимодействия белков уже на этапе анализа последовательности ДНК, а также исследовать роль этих взаимодействий в физиологических процессах.
Работа по созданию уникального программного комплекса заняла около двух лет. Существенный вклад внесли ученые НГУ и ИЦиГ: проект разработали и продолжают развивать сотрудники лаборатории компьютерной транскриптомики и эволюционной биоинформатики Факультета естественных наук НГУ и ИЦиГ Виктор Левицкий, Елена Землянская, и сотрудник ИЦиГ Дмитрий Ощепков. В проекте также принимают активное участие доцент кафедры информационной биологии ФЕН НГУ Татьяна Меркулова, сотрудник ЛКТиЭБ ФЕН НГУ Виктория Миронова и научный руководитель ЛКТиЭБ ФЕН НГУ Иво Гроссе (Германия).
— Разработка позволяет получить гораздо более детальные сведения о регуляторной роли белка на основе эксперимента по массовому секвенированию его сайтов связывания. Если ранее для заданного белка, специфично регулирующего экспрессию генов, аналогичные подходы находили с высокой достоверностью его 3-5 партнеров-белков, то мы с помощью новой разработки находим 10-15, — отметил Виктор Левицкий.
Миллионы клеток организма синтезируют белки, которые непрерывно работают: переносят кислород, защищают от вторжения чужеродных агентов, сокращают и расслабляют мышечные волокна и выполняют массу других функций. Сведения о том, где и когда должны выполняться эти действия, зашифрованы в молекуле ДНК, причем информация записана при помощи всего четырех «букв» — нуклеотидов. Нуклеотиды объединяются в «слова» — гены, и каждый ген несет в себе сведения о белке, который может с него синтезироваться. Структуру и функцию клетки определяет уникальная комбинация белков, и какой ей быть «решают» регуляторные элементы ДНК. Их структурные единицы: короткие последовательности «букв»-нуклеотидов или мотивы — опознаются белками-регуляторами (транскрипционными факторами), что приводит к запуску или, наоборот, блокированию процесса считывания генетической информации.
Новосибирские ученые получили патент на свою программу, она готова к практическому применению. В последние несколько лет появились и продолжают пополняться открытые базы, насчитывающие уже несколько десятков тысяч ChIP-seq экспериментов для разнообразных типов тканей, клеток и для разных белков-регуляторов. Алгоритм сибирских ученых может использоваться для поиска новых партнеров уже известных белков-регуляторов, ключевых для выполнения важных физиологических функций организма, например, иммунного ответа.
Работа выполнялась при поддержке Российского фонда фундаментальных исследований, проект № 18-29-13040, государственного бюджетного проекта № 0324-2019-0040.