18+
18+
РЕКЛАМА

Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

IT, Образование и наука, Томские новости, ученые наука распознавание речи софт для распознавания машина понимает человека перевод речи Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

Научные сотрудники ТУСУРа исследуют малоизученную шепот алгоритмов по распознаванию речи человека с высокой точностью, сообщает региональный инновационный портал.

Над созданием новых, принципиально отличающихся от существующих, алгоритмов распознавания речи работают на кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС). Исследование томичей направлено на решение из главных задач разработчиков во всем мире – добиться полностью автоматического перевода устного текста любого объема в письменный с высокой точностью, без искажений.

«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», - рассказывает сотрудник КИБЭВС Антон Конев.

Основой распространенных алгоритмов является обучение на большом количестве примеров произнесенных звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесенное. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.

«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается и существующие системы ошибаются очень часто. Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе», - подчеркивает Конев.

Своей задачей ученые кафедры КИБЭВС ТУСУР называют определение более точных параметров звуков, в том числе, с помощью изучения шепотной речи.

«Есть классический термин – форманта – максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений», - добавил Антон Конев.

Исследования показали, что распознавание ударных звуков шепотной речи на основе общепринятых параметров возможно с надежностью не менее 70 %. Точное распознавание речи, которое станет доступно в результате исследований, будет полезно для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов.

Томские новости

В Томской области пиво оказалось одним из самых дорогих в Сибири в 2025 году

9 апреля 2026
Томские новости

Томские поезда переходят на летнее расписание

27 апреля 2026
Томские новости

Военный суд приговорил томского подростка к 6,5 годам колонии за госизмену и попытку теракта на желдороге

15 апреля 2026
Томские новости

В Томске отремонтировали десять остановок

20 апреля 2026
Томские новости

В Томске стартует гастрономический фестиваль «Завтрак есть!»

30 апреля 2026
Томские новости

Суд ввел наблюдение в аэропорту Стрежевого по делу о банкротстве из-за долга в 3,4 млн рублей

13 апреля 2026
Томские новости

Томичам расскажут, зачем невестам на Руси «выкалывали глаза»

14 апреля 2026
Томские новости

Новые переливы появились появились на дорогах Томской области

28 апреля 2026
Томские новости

Томичам покажут памятники деревянного зодчества на снимках 1970-80 гг.

18 апреля 2026