18+
18+
РЕКЛАМА

Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

IT, Образование и наука, Томские новости, ученые наука распознавание речи софт для распознавания машина понимает человека перевод речи Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

Научные сотрудники ТУСУРа исследуют малоизученную шепот алгоритмов по распознаванию речи человека с высокой точностью, сообщает региональный инновационный портал.

Над созданием новых, принципиально отличающихся от существующих, алгоритмов распознавания речи работают на кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС). Исследование томичей направлено на решение из главных задач разработчиков во всем мире – добиться полностью автоматического перевода устного текста любого объема в письменный с высокой точностью, без искажений.

«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», - рассказывает сотрудник КИБЭВС Антон Конев.

Основой распространенных алгоритмов является обучение на большом количестве примеров произнесенных звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесенное. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.

«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается и существующие системы ошибаются очень часто. Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе», - подчеркивает Конев.

Своей задачей ученые кафедры КИБЭВС ТУСУР называют определение более точных параметров звуков, в том числе, с помощью изучения шепотной речи.

«Есть классический термин – форманта – максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений», - добавил Антон Конев.

Исследования показали, что распознавание ударных звуков шепотной речи на основе общепринятых параметров возможно с надежностью не менее 70 %. Точное распознавание речи, которое станет доступно в результате исследований, будет полезно для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов.

Томские новости

В Томске стартовала благотворительная акция «Стань волшебником!»

13 декабря 2025
Томские новости

На днях томичей ждут мокрый снег и сильный ветер

21 ноября 2025
Томские новости

В Томской области открыли первые ледовые переправы

28 ноября 2025
Томские новости

Более 70 мероприятий прошли в Томской области в рамках декады инвалидов

5 декабря 2025
Томские новости

Главную томскую елку зажгли на Ново-Соборной площади

17 декабря 2025
Томские новости

Тысячи поводов для встречи: новый бренд «Игры Ростелеком» объединяет геймеров и разработчиков

27 ноября 2025
Томские новости

В Томске установили искусственные неровности на Герцена и Горького

1 декабря 2025
Томские новости

В Томске сносят деревянный дом на Московском тракте

12 декабря 2025
Томские новости

Томичей приглашают послушать русские народные страшилки

26 ноября 2025