В ТГУ открылся Центр коллективного пользования платформой для аналитики big data
На базе суперкомпьютера Томского государственного университета открылся совместный Центр коллективного использования платформой PolyAnalyst, сообщает пресс-служба вуза.
Программное обеспечение PolyAnalyst — это система текстовой аналитики и извлечения полезной информации из данных, которая имеет богатый набор алгоритмов машинного обучения и передовых инструментов обработки естественного языка. Компания «Мегапьютер Интеллидженс» предоставляет академическую лицензию с возможностью организации 50 рабочих мест.
«Создание ЦКП позволит быстро создавать прототипы цифровых сервисов автоматизации бизнес-процессов и выстраивать алгоритмы обработки данных в исследовательских проектах, — комментирует Вячеслав Гойко, директор Центра прикладного анализа больших данных ТГУ. — Например, у нас стояла задача классификации текстовых сообщений по тематике и тональности для оценки отзывов пользователей, и подготовленный в PolyAnalyst сценарий позволил полностью автоматизировать данный процесс».
Новый ЦКП будет использоваться для реализации прикладных проектов, решения задач, связанных с анализом данных, а также подготовки и обучения сотрудников других университетов. Вычислительной инфраструктурой ЦКП станет суперкомпьютер ТГУ СКИФ Cyberia, суммарная производительность которого на сегодня 240 Тфлопс (240 триллионов операций в секунду).
«Сегодня при наличии специализированного программного обеспечения эта мощность позволяет строить алгоритмы обработки текста, тренировать нейронные сети и строить модели обработки данных в десятки раз быстрее, чем когда бы то ни было. А предоставление коллективного доступа к комбинации такой мощности и специализированного ПО еще и обеспечивает работу в парадигме открытой науки», — отмечает директор суперкомпьютерного центра ТГУ Сергей Орлов.
Ряд российских университетов уже запросили доступ к работе в ЦКП, а Вятский государственный университет начинает совместный с ТГУ проект, добавил научный руководитель Центра прикладного анализа больших данных ТГУ, председатель совета Университетского консорциума исследователей больших данных Михаил Мягков. Доступ исследователей к ресурсам ЦКП будет бесплатным, нужно будет только заполнить регистрационную форму и отправить заявку проекта.
Компания «Мегапьютер Интеллидженс» является индустриальным партнером Центра прикладного анализа данных и инициированного ТГУ Университетского консорциума исследователей больших данных. С помощью предоставленной платформы реализованы исследовательские и прикладные проекты, например, создана классификация сообщений фондов целевых капиталов, проведена оценка информационного образа университета по данным социальных медиа, выполнен анализ мнений и настроений в регионах РФ. Также с использованием ПО этой компании созданы образовательные модули для школы прикладного анализа данных.