Сибирский гринфилд. Сергей Орлов о суперкомпьютере, больших данных и новом цифровом обществе
Центр компетенций по управлению, основанному на данных (CDO) ТГУ — сложносочиненная система, не имеющая иерархической структуры. В него входит суперкомпьютерный центр, лаборатории, образовательные команды.
Руководитель Центра Сергей Орлов объяснил нам, как устроен этот сложный организм, рассказал, как с помощью больших данных можно изменить мир, а также зачем его коллеги мастерят беспилотный летательный аппарат.
Коллаборация гринфилдов
Центр компетенций строится из пяти направлений. Первое — это инфраструктура, в данном случае суперкомпьютерный центр СКИФ-Cyberia с центром коллективного пользования и центром обработки данных.
Второе — исследовательская составляющая. В состав центра входит лаборатория наук о больших данных и проблемах общества, которой руководит Вячеслав Гойко. Тесно связана с ним лаборатория компьютерных средств обучения, ее возглавляет Артем Фещенко.
Третья составляющая — образовательная. К ней относится программа по обучению государственных служащих новым технологиям и возможностям цифровой экономики. Также Центр тесно сотрудничает с магистратурой по направлению «Интеллектуальный анализ данных» в Институте прикладной математики и компьютерных наук.
Четвертая и пятая составляющие — разработка IT-решений и консалтинг. Их запуск и отладка еще идут.
Каждое из направлений — гринфилд сам по себе: это новые места, где рождаются знания. Но и весь Центр компетенций можно назвать организационным гринфилдом, поскольку его задача — совместить в едином поле таких разных участников.
— Мне кажется, так более правильно с точки зрения университетского духа и академической свободы, — говорит Сергей Орлов. — Я небольшой в этом специалист, но мне кажется, что Томский университет, с одной стороны, — браунфилд, «коричневое поле», где уже всё пахано-перепахано. С другой стороны, мы заходим на те поляны, на которых еще никого не было. Хотя я уже не первый год иду по этому полю, поэтому мне кажется, что это нормально, так и должно быть.
Суперкомпьютер
Первый гринфилд Сергея Орлова (хотя тогда это слово не использовалось в его нынешнем понимании) случился в 2006 году, когда он, еще студент ФТФ, начал работать в команде суперкомпьютерного центра. В 2007-м СКИФ запустили, и Сергей остался с ним работать. Параллельно писал кандидатскую на тему переноса загрязнений в атмосфере, данные для которой анализировал на суперкомпьютере.
— СКИФ вообще изначально был рассчитан на решение задач математической физики, экологии, метеорологии, — говорит Сергей. — Спустя какое-то время часть научных коллективов по разным причинам перестали на нем работать. Зато появились новые научные направления, в частности в 2016 году занялись темой соцсетей, которые в 2007 году еще только зарождались. Как не было и методов анализа, которые позволили бы обрабатывать большие массивы данных.
Суперкомпьютер — это около тысячи серверов, которые объединены несколькими сетями в единую логическую структуру. Пользователь ставит задачи, а сама система уже раскидывает их по серверам, распараллеливая и ускоряя. Таким образом можно в 1000 раз ускорить расчет задачи по сравнению с обычным компьютером.
Сервера расположены в двух залах — «старом» и «новом». Обозначение условное, так как оборудование постоянно меняется на более современное, и от серверов 2007 года фактически осталась только оболочка.
Большие вычислительные мощности требуют хорошего охлаждения. В СКИФе оно трех- и четырехконтурное, а теплообменники стоят на крыше и в подвале здания. Есть две линии электроснабжения с источниками бесперебойного питания. Сервера соединены в сеть посредством оптических кабелей, общая длина которых — 5,5 километров.
СКИФ одновременно может обрабатывать множество сложных задач: от моделирования разработки нефтяных пластов по хоздоговорам с «ТомскНИПИнефтью» до обработки данных эксперимента ATLAS на Большом адронном коллайдере; от проектирования космических аппаратов до расчетов спецэффектов для киноиндустрии.
Одна из интересных задач, которой сегодня заняты мощности суперкомпьютера — это анализ страниц пользователей социальной сети «ВКонтакте» с целью поиска талантливых и мотивированных абитуриентов. Но это не все, на что годятся данные из соцсетей.
— У нас множество проектов. Например, анализ страниц пользователей помогает выявить не только талантливых абитуриентов, но и экстремистов. Еще с их помощью можно описать проблемы и достижения в регионе с точки зрения жителей, — рассказывает заведующий лабораторией наук о больших данных и проблемах общества Вячеслав Гойко. — Совместно с Фондом Потанина мы делаем проект по исследованию онлайн-благотворительности. Сейчас 72 университета открыли фонды целевого капитала, но никто не знает, как заставить выпускников массово перечислять деньги. Наша идея в том, что могут помочь социальные сети. И мы сейчас вместе с благотворительным фондом пытаемся разработать механизмы, которые убедили бы выпускников жертвовать деньги университету.
В одном из помещений Центра компетенций стоит каркас беспилотника. Аппарат мастерит своими руками группа сотрудников и студентов ради запуска нового направления по созданию цифровых двойников летательных аппаратов.
— Наши ребята, выходцы с кафедры прикладной аэромеханики, решили: «Почему бы не сделать беспилотник?» И вот взяли и делают, — улыбается Орлов.
Беспилотник изготавливается на основе цифрового двойника. Сначала его полностью смоделировали на компьютере, «продули» в цифровой аэродинамической трубе, а уже потом начали воплощать в материальном виде. Сделали шаблоны, на станке с ЧПУ вырезали каркас, напечатали на 3D-принтере некоторые детали. Летательный аппарат будет покрыт
карбоновым композитом, который тоже изготовят в ТГУ, и оснащен двигателем и фотокамерой.
Кадры для цифровой трансформации
Когда произойдет цифровая трансформация (а это вопрос уже недалекого будущего), на основе объективного анализа больших данных будет приниматься большинство административных решений, в том числе и в государственном управлении.
ТГУ совместно с администрацией Томской области с 2019 года начал обучать госслужащих тому, как применять анализ данных для решения управленческих задач, каким образом добывать эти данные, на какие данные надо ориентироваться, а на какие не надо, и так далее. Программа рассчитана на 102 часа, из них 60 очных. Ее особенность — высокая интенсивность работы и практическая ориентированность.
— Там нельзя по два часа в день ходить на лекции и растянуть программу на месяц. Рабочие дела будут отвлекать, и особого эффекта не произойдет. У нас логика такая: человек должен попасть в среду, когда ему интеллектуально очень сложно, и тогда происходит рост, — говорит Сергей Орлов. — Думаю, что мы выполняем эту задачу: дать людям образ будущего, чтобы они увидели, куда двигаться. И если вначале у некоторых слушателей чувствовалось раздражение: «Зачем всё это, только на неделю из работы выпали», то в конце практически все написали в отзывах, что курсы изменили их мышление.
В прошлом году программу дополнительного образования прошли 500 специалистов из 12 регионов: от Томской области до Якутии. В основном, из государственных структур, связанных с образованием, здравоохранением и социальной сферой, а также вузов.
— Рано или поздно все данные будут оцифрованы и управленческие процессы, основанные на этих данных, тоже станут цифровыми, — объясняет Сергей. — Все станет прозрачным, по крайней мере, для тех, кто к этим данным будет иметь доступ. Не будет разных скрытых факторов, ни в экономике, ни в социальной сфере. А с другой стороны, я понимаю, что будет большое сопротивление, просто потому что не все заинтересованы в объективизации данных. Но в любом случае, это будет уже другое общество.
Текст: Катерина Кайгородова
Фото: Вероника Белецкая