Вычислительная инфраструктура для работы с технологиями искусственного интеллекта

1. Для чего современному университету нужен суперкомпьютер

Современное развитие информационных технологий доказало, что обязательным условием для работ в области искусственного интеллекта является наличие мощной вычислительной инфраструктуры. Как правило, речь идет о суперкомпьютерах – специализированных вычислительных машинах, значительно превосходящих по своим техническим параметрам и скорости вычислений компьютеры общего пользования. Обычно современные суперкомпьютеры представляют собой большое число высокопроизводительных серверных компьютеров, соединённых друг с другом локальной высокоскоростной магистралью для достижения максимальной производительности в параллельных вычислениях.

Использование суперкомпьютеров является актуальным и для Новосибирского государственного университета, где сразу несколько образовательных программ подразумевают доступ обучающихся к соответствующим вычислительным мощностям.

Так, важной частью обучения в Институте интеллектуальной робототехники НГУ является участие в хакатонах, которое подразумевает выполнение проектов машинного обучения, связанных с большими данными и технологиями искусственного интеллекта. И практически любой проект, который запускается в рамках таких хакатонов, требует доступа к графическим ускорителям.

В рамках более традиционных образовательных курсов также все чаще возникает необходимость работы с глубокими нейронными сетями и мы сталкиваемся с растущей потребностью в вычислительных ресурсах, на порядки превосходящих по мощности терминалы компьютерных классов. Курс «Параллельное программирование» подразумевает использование библиотек типа CUDA, для которых многопоточный и распределенный режим выполнения программ является основным способом максимально ускорить процесс вычислений.

Несколько лет назад в НГУ запустили суперкомпьютер DL-House, который занял 25-е место в списке в топ-50 лучших компьютеров на территории СНГ и стал основой для работы графического вычислительного кластера, созданного в университете. Это была своего рода проба сил, проект, на котором отрабатывалась методика работы в данном направлении, и вокруг которого создавались группы разработчиков, использующих технологии ИИ.

Такой опыт доказал высокий уровень востребованности такого типа вычислений. И одновременно – не менее высокую востребованность в развитии собственной вычислительной инфраструктуры университета, поскольку нейронные сети и другие модели искусственного интеллекта сейчас развиваются быстрыми темпами и уже в ближайшие годы имеющихся у НГУ мощностей не хватит даже для демонстрационного запуска современных проектов в области ИИ, не говоря уже о собственной разработке и обучении таких очень актуальных, ресурсоемких проектов как большие языковые модели. Если университет хочет и далее выпускать специалистов в области информационных технологий высокого уровня, качественное усиление собственных вычислительных мощностей является критически важным условием.

Это стало главной движущей силой возникновения проекта создания Суперкомпьютерного центра и Центра компетенций по высокопоставленными вычислениям и искусственному интеллекту СКЦ «Лаврентьев», который реализуется консорциумом НГУ и ведущих институтов Новосибирского научного центра.

2. Особенности выбора оборудования и архитектуры проекта СКЦ «Лаврентьев»

Предполагается, что в первом квартале 2024 года в рамках СКЦ «Лаврентьев» будет запущен пилотный проект графического суперкластера для обучения больших языковых моделей. Помимо собственно выполнения проектов, связанных с языковыми моделями, предполагается отработать на этом пилотном проекте взаимодействие членов консорциума, распределение рабочего времени и задач, оценку их приоритетности, чтобы, когда СКЦ «Лаврентьев» будет запущен полностью, не тратить на это дополнительное время.

Окончательное завершение строительства СКЦ «Лаврентьев» запланировано к 2025 году. Его пиковая вычислительная мощность составит 10 петафлопс, а объём хранения данных – 10 петабайт.

Ряд других параметров, заложенных в проект изначально, впоследствии был заметно изменен, прежде всего, в соответствии с общим развитием суперкомпьютеров и применяемого в них оборудования.

Весомое влияние на реализацию проекта оказала и жесткая санкционная политика западных стран в отношении России, развернутая с началом СВО. Каждый суперкомпьютер представляет собой спектр уникальных технологий, создаваемых крупными «традиционными» игроками компьютерной индустрии. И уход с российского рынка целого ряда ключевых вендоров, таких как AMD или NVidia, создал запрос на поиск адекватной замены их оборудованию. Это, пожалуй, в настоящее время является основным вызовом в процессе реализации проекта СКЦ «Лаврентьев».

Наиболее очевидным вариантом является развитие сотрудничества с китайским компаниями-производителями аналогичного оборудования, которые в настоящее время демонстрируют быстрый рост производительности.

Несмотря на общий тренд разработки мультиплатформенного и кросс-платформенного программного обеспечения, высокопроизводительные приложения для суперкомпьютерных вычислений адаптированы под оборудование конкретного производителя. И переориентация на китайские компании неизбежно потребует переобучения кадров на работу с новым программным обеспечением, которое имеет свои специфические особенности.

Еще один возможный вариант решения задачи – использование серверного и иного оборудования российских производителей на базе процессоров «Эльбрус». И в настоящее время М. А. Марченко, директор входящего в консорциум проекта Института вычислительной математики и математической геофизики СО РАН, активно прорабатывает этот вопрос.

Надо понимать, что вопрос поиска альтернатив западным поставщикам серверного и иного специфического компьютерного оборудования встает сегодня не только перед нашим проектом, а перед российской экономикой в целом. И указанные выше задачи предстоит решать в рамках многих высокотехнологичных проектов на территории страны, что неизбежно повлечет значительную диверсификацию используемого оборудования. Это, возможно, означает, что у СКЦ «Лаврентьев» появляется новая важная миссия – подготовка кадров для технологий искусственного интеллекта, проводимых с помощью самых разных программных решений – отечественных, западных, китайских и др.

Площадкой для размещения суперкомпьютера станет новый кампус Новосибирского университета, возводимый в рамках национального проекта «Наука и университеты» и этому также есть свое объяснение. СКЦ «Лаврентьев» отличается высоким энергопотреблением, предполагается, что его расчетная мощность будет составлять один мегаватт. В старом кампусе НГУ таких свободных мощностей просто нет, они появятся только с введением в строй нового исследовательского корпуса.

Кроме того, суперкомпьютеру требуется очень высокая скорость передачи данных, что означает – он должен быть установлен недалеко от тех мест, где они производятся. В данном случае, это консорциум пользователей, куда входит как университет, так и близлежащие научные институты Академгородка, а также строящийся Сибирский кольцевой источник фотонов (СКИФ). Поэтому, с точки зрения эксплуатации, скорости передачи данных, эффективно расположить его на территории кампуса НГУ.

Современные суперкомпьютерные системы отличает гибкая вычислительная архитектура, выстраиваемая под конкретные задачи, которые предполагается решать на них. Университет планирует использовать этот центр для решения больших задач, которые можно разбить на два подкласса. К первому относятся те, что связаны с численным моделированием и цифровыми двойниками. Это могут быть как чисто технические задачи от индустриальных партнеров по моделированию технологических новинок, планируемых к производству (например, новые типы авиадвигателей), так и чисто научные исследования - построение моделей изменения климата, распространения заболеваний и проч. Такого рода задачи требуют проведения вычислений с максимальной точностью и эффективно выполняются на центральных процессорах.

Второй подкласс задач связан с искусственным интеллектом. Недавно была установлена прямая зависимость способности модели к обучению от количества параметров, задействованных в обучении. Поэтому для решения такого типа задач важна не столько высокая точность вычислений, сколько возможность параллельно производить огромное количество простых операций (умножение, сложение, взятие максимума и т.п.). Соответственно, вычислительная архитектура для решения требует большого количества не очень мощных процессоров, которые будут в рутинном режиме выполнять эти операции. Обычно это реализуется на базе графических кластеров, но в последнее время стали выпускать чипы, специализированные уже под математические операции, которые используются искусственным интеллектом, так называемые, нейронные (или тензорные) процессорные единицы.

Поскольку рынок обоих типов задач в ближайшее время будет только расти, ожидается, что архитектура университетского суперкомпьютера будет гибридной, сочетая обе возможности. Сейчас вопрос стоит в том, стоит ли стремиться при этом, чтобы СКЦ «Лаврентьев» работал как некая единая машина, либо он будет реализован в формате свободно существующих кластеров, которые обращаются к общему хранилищу информации. И окончательное решение этого вопроса также будет во многом зависеть от того, какое оборудование будет использовано в его строительстве. Тем более, что и тот и другой подход к архитектуре суперкомпьютера позволит в дальнейшем работать с обеими типами задач.

3. Задачи в области искусственного интеллекта, которые предполагается решать с помощью СКЦ «Лаврентьев»

Как уже говорилось выше, одной из главных задач университета является подготовка высококлассных специалистов в области машинного зрения, больших языковых моделей и других направлений применения технологий искусственного интеллекта. Сегодня уже очевидно, что глубокие нейронные сети (ГНС, англ. DNN – Deep neural network) ГНС – это сквозная технология, которая может применяться в самых разных областях. А когда появились большие языковые модели, успешно справившиеся с тестом Тьюринга, возможности этой технологии и спрос на специалистов, владеющих ее применением еще более выросли.

Крупные корпорации решают эту проблему, используя различные инструменты, включая запуск совместных с вузами образовательных программ, нацеленных на подготовку будущих специалистов «под себя». Но средний, а тем более малый бизнес не имеет такой возможности и это, в частности, обуславливает их высокий интерес к студентам НГУ, многие из которых получают предложения о трудоустройстве еще на стадии обучения.

Этому способствует и то, что сразу после получения минимальной теоретической базы, достаточной для работы с моделями искусственного интеллекта, студенты университета вовлекаются в проектную и практическую работу. Такой подход формирует свои требования и к преподавательскому составу, что можно хорошо продемонстрировать на примере Института интеллектуальной робототехники. ИИР НГУ нацелен на создание собственного пула разработчиков–преподавателей. Соответственно сотрудники принимаются сразу на две позиции: разработчика (инженер) и профессорско-преподавательский состав. Нагрузка по должности преподавателя варьируется от 6 до 10 часов. По должности разработчика сотрудники института выполняют поисковые и пилотные проекты в области машинного обучения, технического зрения, беспилотного транспорта в инициативном порядке и за счет средств индустриальных партнеров. Предполагается, что к 2028 году деятельность в области разработки инновационных продуктов и технологий должна приносить не менее 50 % доходов ИИР НГУ.

Необходимо подчеркнуть, что работа над созданием отечественных программных продуктов и оборудования, использующих в своей работе технологии искусственного интеллекта, является не менее важной, чем подготовка кадров. Есть сразу несколько блоков задач, работать над которыми позволяют компетенции сотрудников и студентов Новосибирского государственного университета.

Это системы, обеспечивающие безопасность в самых разных ее аспектах, от информационной безопасности до систем экологического мониторинга и анализа дорожного траффика с целью выявления потенциально опасных его участников.

Отдельный блок составляют решения на основе языковых моделей – чат-боты, разнообразные голосовые помощники, электронные секретари и тому подобное. Здесь очень важно правильно обучить нейронную сеть, чтобы она давала правильные ответы на запросы пользователей, содержащие необходимую им конкретную информацию, а не общие формулировки.

К этому же блоку примыкают программы, занимающиеся анализом больших объемов данных, начиная с относительно простых систем отслеживания траффика в социальных сетях на предмет наличия запрещенного контента.

Очевидно, что многие такие решения и продукты сегодня являются обязательной составляющей набора технологий «умного города». Например, «умная» видеоаналитика, которая обеспечит не только сбор необходимой информации для различных служб городского хозяйства и постоянный мониторинг ситуации, но и возможность прогнозировать ее развитие, предупреждать о проблемной или потенциально опасной ситуации до того, как она возникнет, что позволит избежать ее развития или хотя бы оперативно на нее отреагировать.

Например, в области отслеживания транспорта эти системы давно научились фиксировать каждое транспортное средство, идентифицировать его номер на основе ряда неполных изображений и отслеживать перемещения по улицам города. Следующий шаг, научиться выделять отдельных участников дорожного движения, как транспортных средств, так и пешеходов, прогнозировать их поведение и предотвращать возможные причины возникновения аварийной ситуации. Другой возможный пример – разработка системы, способной анализировать уровень снежного покрова на городских улицах, интенсивность выпадения осадков и на основе обработки этой информации формировать маршруты для работы снегоуборочной техники.

Еще больше возможностей таким системам даст их интеграция с беспилотными летательными аппаратами (БПЛА). Камеры БПЛА имеют гораздо большую область захватываемого изображения, в силу мобильности каждый аппарат способен осуществлять мониторинг значительной территории, причем его эффективность гораздо меньше зависит от рельефа местности, чем у камер, закрепленных на наземных объектах (зданиях, столбах, транспорте).

А использование технологий искусственного интеллекта позволит БПЛА не просто собирать информацию, но и проводить ее первичную обработку в ходе полета, осуществлять ее оперативную передачу нужному адресату и так далее. Подобные решения обладают исключительно большим потенциалом с точки зрения задач городского хозяйства, его развития и оптимизации. И сейчас сотрудники НГУ активно и плодотворно работают в области оснащения БПЛА искусственным интеллектом, чтобы они могли не только обеспечивать сбор информации или запоминать маршрут полета, самостоятельно возвращаясь к точке старта, но и решали бы гораздо более сложные задачи.

Не менее перспективной является разработка разнообразных сервисов, нацеленных на взаимодействие с населением – электронных приемных, чат-ботов и других помощников, которые уже сегодня становятся практически обязательной составляющей работы разных подразделений муниципалитетов и оперативных служб.

Важной характеристикой по-настоящему «умного города» является наличие в нем некоего ситуационного центра, где концентрируется и обрабатывается огромный поток информации: результаты различных систем мониторинга, обращения граждан в разнообразные «электронные приемные», отчеты о работе городских служб и многое другое. Для оперативной и в то же время качественной обработки всего этого массива данных такой центр должен обладать собственными суперкомпьютерными мощностями. Только тогда получится качественно объединить весь набор технологий «умного города» в некую единую цифровую экосистему, где внедрение одних решений согласовывается с другими, а их работа взаимно интегрирована.

При этом надо понимать, что любой сбой в работе этой экосистемы может повлечь за собой достаточно серьезные последствия для всех жителей города. Очевидно, что решение столь сложной и многоплановой задачи оптимально изначально опробовать в меньшем масштабе на некоем полигоне, в роли которого может выступать «умный кампус» Новосибирского государственного университета.

Внедряя на его территории собственные разработки в области видеоаналитики, голосовых помощников и т.п. – мы сможем оптимизировать работу его инфраструктуры, организации образовательного процесса и досуга студентов и преподавателей, транспортные потоки на территории кампуса и другие составляющие его жизни с помощью технологий искусственного интеллекта. А единым центром анализа и управления работой всей этой «умной» инфраструктуры станет Суперкомпьютерный центр «Лаврентьев».