18+
18+
Siberian greenfield, Образование и наука, ТГУ, Центр компетенций по управлению основанному на данных ТГУ Сергей Орлов суперкомпьютер СКИФ Сибирский гринфилд. Сергей Орлов о суперкомпьютере, больших данных и новом цифровом обществе

Сибирский гринфилд. Сергей Орлов о суперкомпьютере, больших данных и новом цифровом обществе

Центр компетенций по управлению, основанному на данных (CDO) ТГУ — сложносочиненная система, не имеющая иерархической структуры. В него входит суперкомпьютерный центр, лаборатории, образовательные команды.

Руководитель Центра Сергей Орлов объяснил нам, как устроен этот сложный организм, рассказал, как с помощью больших данных можно изменить мир, а также зачем его коллеги мастерят беспилотный летательный аппарат.

Коллаборация гринфилдов

Центр компетенций строится из пяти направлений. Первое — это инфраструктура, в данном случае суперкомпьютерный центр СКИФ-Cyberia с центром коллективного пользования и центром обработки данных.

Второе — исследовательская составляющая. В состав центра входит лаборатория наук о больших данных и проблемах общества, которой руководит Вячеслав Гойко. Тесно связана с ним лаборатория компьютерных средств обучения, ее возглавляет Артем Фещенко.

Третья составляющая — образовательная. К ней относится программа по обучению государственных служащих новым технологиям и возможностям цифровой экономики. Также Центр тесно сотрудничает с магистратурой по направлению «Интеллектуальный анализ данных» в Институте прикладной математики и компьютерных наук.

Четвертая и пятая составляющие — разработка IT-решений и консалтинг. Их запуск и отладка еще идут.

Каждое из направлений — гринфилд сам по себе: это новые места, где рождаются знания. Но и весь Центр компетенций можно назвать организационным гринфилдом, поскольку его задача — совместить в едином поле таких разных участников.

— Мне кажется, так более правильно с точки зрения университетского духа и академической свободы, — говорит Сергей Орлов. — Я небольшой в этом специалист, но мне кажется, что Томский университет, с одной стороны, — браунфилд, «коричневое поле», где уже всё пахано-перепахано. С другой стороны, мы заходим на те поляны, на которых еще никого не было. Хотя я уже не первый год иду по этому полю, поэтому мне кажется, что это нормально, так и должно быть.

Суперкомпьютер

Первый гринфилд Сергея Орлова (хотя тогда это слово не использовалось в его нынешнем понимании) случился в 2006 году, когда он, еще студент ФТФ, начал работать в команде суперкомпьютерного центра. В 2007-м СКИФ запустили, и Сергей остался с ним работать. Параллельно писал кандидатскую на тему переноса загрязнений в атмосфере, данные для которой анализировал на суперкомпьютере.

— СКИФ вообще изначально был рассчитан на решение задач математической физики, экологии, метеорологии, — говорит Сергей. — Спустя какое-то время часть научных коллективов по разным причинам перестали на нем работать. Зато появились новые научные направления, в частности в 2016 году занялись темой соцсетей, которые в 2007 году еще только зарождались. Как не было и методов анализа, которые позволили бы обрабатывать большие массивы данных.

Суперкомпьютер — это около тысячи серверов, которые объединены несколькими сетями в единую логическую структуру. Пользователь ставит задачи, а сама система уже раскидывает их по серверам, распараллеливая и ускоряя. Таким образом можно в 1000 раз ускорить расчет задачи по сравнению с обычным компьютером.

Сервера расположены в двух залах — «старом» и «новом». Обозначение условное, так как оборудование постоянно меняется на более современное, и от серверов 2007 года фактически осталась только оболочка.

Большие вычислительные мощности требуют хорошего охлаждения. В СКИФе оно трех- и четырехконтурное, а теплообменники стоят на крыше и в подвале здания. Есть две линии электроснабжения с источниками бесперебойного питания. Сервера соединены в сеть посредством оптических кабелей, общая длина которых — 5,5 километров.

СКИФ одновременно может обрабатывать множество сложных задач: от моделирования разработки нефтяных пластов по хоздоговорам с «ТомскНИПИнефтью» до обработки данных эксперимента ATLAS на Большом адронном коллайдере; от проектирования космических аппаратов до расчетов спецэффектов для киноиндустрии.

Одна из интересных задач, которой сегодня заняты мощности суперкомпьютера — это анализ страниц пользователей социальной сети «ВКонтакте» с целью поиска талантливых и мотивированных абитуриентов. Но это не все, на что годятся данные из соцсетей.

— У нас множество проектов. Например, анализ страниц пользователей помогает выявить не только талантливых абитуриентов, но и экстремистов. Еще с их помощью можно описать проблемы и достижения в регионе с точки зрения жителей, — рассказывает заведующий лабораторией наук о больших данных и проблемах общества Вячеслав Гойко. — Совместно с Фондом Потанина мы делаем проект по исследованию онлайн-благотворительности. Сейчас 72 университета открыли фонды целевого капитала, но никто не знает, как заставить выпускников массово перечислять деньги. Наша идея в том, что могут помочь социальные сети. И мы сейчас вместе с благотворительным фондом пытаемся разработать механизмы, которые убедили бы выпускников жертвовать деньги университету.

В одном из помещений Центра компетенций стоит каркас беспилотника. Аппарат мастерит своими руками группа сотрудников и студентов ради запуска нового направления по созданию цифровых двойников летательных аппаратов.

— Наши ребята, выходцы с кафедры прикладной аэромеханики, решили: «Почему бы не сделать беспилотник?» И вот взяли и делают, — улыбается Орлов.

Беспилотник изготавливается на основе цифрового двойника. Сначала его полностью смоделировали на компьютере, «продули» в цифровой аэродинамической трубе, а уже потом начали воплощать в материальном виде. Сделали шаблоны, на станке с ЧПУ вырезали каркас, напечатали на 3D-принтере некоторые детали. Летательный аппарат будет покрыт
карбоновым композитом, который тоже изготовят в ТГУ, и оснащен двигателем и фотокамерой.

Кадры для цифровой трансформации

Когда произойдет цифровая трансформация (а это вопрос уже недалекого будущего), на основе объективного анализа больших данных будет приниматься большинство административных решений, в том числе и в государственном управлении.

ТГУ совместно с администрацией Томской области с 2019 года начал обучать госслужащих тому, как применять анализ данных для решения управленческих задач, каким образом добывать эти данные, на какие данные надо ориентироваться, а на какие не надо, и так далее. Программа рассчитана на 102 часа, из них 60 очных. Ее особенность — высокая интенсивность работы и практическая ориентированность.

— Там нельзя по два часа в день ходить на лекции и растянуть программу на месяц. Рабочие дела будут отвлекать, и особого эффекта не произойдет. У нас логика такая: человек должен попасть в среду, когда ему интеллектуально очень сложно, и тогда происходит рост, — говорит Сергей Орлов. — Думаю, что мы выполняем эту задачу: дать людям образ будущего, чтобы они увидели, куда двигаться. И если вначале у некоторых слушателей чувствовалось раздражение: «Зачем всё это, только на неделю из работы выпали», то в конце практически все написали в отзывах, что курсы изменили их мышление.


В прошлом году программу дополнительного образования прошли 500 специалистов из 12 регионов: от Томской области до Якутии. В основном, из государственных структур, связанных с образованием, здравоохранением и социальной сферой, а также вузов.

— Рано или поздно все данные будут оцифрованы и управленческие процессы, основанные на этих данных, тоже станут цифровыми, — объясняет Сергей. — Все станет прозрачным, по крайней мере, для тех, кто к этим данным будет иметь доступ. Не будет разных скрытых факторов, ни в экономике, ни в социальной сфере. А с другой стороны, я понимаю, что будет большое сопротивление, просто потому что не все заинтересованы в объективизации данных. Но в любом случае, это будет уже другое общество.

Текст: Катерина Кайгородова
Фото: Вероника Белецкая