Лаборатория аналитики потоковых данных и машинного обучения (ЛАПДиМО) Механико-математического факультета НГУ создана в декабре 2015 года.
Задачи лаборатории:
- применение современных методов глубинного обучения для создания технологий и технических решений по видеонаблюдению, распознаванию речи, мониторингу социальных сетей и идентификации личности;
- разработка новых методов высокоскоростной от 100 ГБит/с интеллектуальной обработки сетевого трафика с использованием GPU и FPGA;
- развитие прикладных методов анализа больших данных в области обработки естественных языков, распознавания речи, распознавания изображений;
- создание квантово-статистической теории измерений для машинного обучения;
- развитие методологии FRiS анализа данных и её техническое воплощение.
Проекты лаборатории
- Разработка аналитических инструментов потоковой обработки данных. Заказчик — ООО «Сигнатек».
- Магистерская программа “Big Data Analytics” (на английском языке)
- Курсы повышения квалификации «Аналитика больших данных для бизнес-задач» в партнёрстве с ООО «Экспасофт». За 2015-2017 гг. обучено 50 специалистов.
- Проведение международной конференции IEEE Siberian Symposium on Data Science and Engineering (SSDSE) 14 апреля 2016 г. под эгидой IEEE.
- Центр НТИ больших данных в НГУ.
Разработки лаборатории:
- видеорезюме;
- идентификация дикторов;
- распознавание документов государственного образца (Павловский Е.Н., Луппов Д.А., Зырянов А.О., Алямкин С.А. Модуль анализа графической и видеоинформации: классификатор бланков документов. // Свидетельство о государственной регистрации программы для ЭВМ № 2017612227 от 17.02.2017.);
- разрешение кореференции;
- классификатор новостных сводок (Павловский Е.Н., Масловский И.А., Батура Т.В., Дюбанов В.В. Модуль анализа текстовой информации: классификатор текстов. // Свидетельство о государственной регистрации программы для ЭВМ № 2017611829 от 09.02.2017.);
- сбор досье из открытых источников.
Оборудование лаборатории:
- NVIDIA DIGITS сервер глубинного обучения ( процессор: 1×CPU Intel® Xeon® E5-2699v3 45Mb Cache 18C/36T / 2.30Ghz; сопроцессор: 4х12Гбайт NVIDIA GeForce TITAN X; оперативная память: 128Гбайт (16×8) 2133 МГц ECC REG);
- 2 рабочие станции для обучения нейросетей (процессор: 1×CPU Intel Core i7 6700K (4C, 3.4GHz, 2400MHz, 8MB, 140W) или 1×CPU Intel Xeon E5-1630 v3 (4C, 3.7GHz, 3.8GHz Turbo, 10MB, 140W) ; сопроцессор: 12 Гбайт NVIDIA GeForce TITAN X; оперативная память: 32 Гбайт (2×16) 2133 МГц ECC REG);
- 2 рабочие станции для работы с сетевым трафиком (процессор: 1×CPU Intel Xeon E5-1620 v4 (4C, 3.5GHz, 3.8GHz Turbo, 2400MHz, 10MB, 140W); сопроцессор: 8 Гбайт NVIDIA Quadro M4000; оперативная память: 32 Гбайт (4×8) 2133 МГц ECC REG; сетевой адаптер: 40GbE.Mellanox ConnectX-4 Lx EN);
- сервер для хранения данных (процессор: 1×CPU Intel® Xeon® E5-2620v2 15Mb Cache 6C/12T / 2.10Ghz; хранение: 2х2Тбайт SATA3 Caviar Green 64Mb; оперативная память: 32 Гбайт (16×2) 2133 МГц ECC REG;);
- сервер для обработки сетевых данных (двухпроцессорная система: 2×CPU Intel® Xeon® E5-2698v4 50Mb Cache 20C/40T / 2.20Ghz; сопроцессор: 12Гбайт NVIDIA Tesla K40; оперативная память: 128Гбайт (16×8) 2133 МГц ECC REG; сетевые адаптеры 80GbE: 2×40 GbE Mellanox InnovaFlex-4 Lx (with programmable FPGA); сетевой акселератор: 40GbE (4×10GbE) Napatech NAC NT-40-E3-4-PTP ).
Партнёры лаборатории:
Группа лаборатории ВКонтакте