18+
18+
РЕКЛАМА

Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

IT, Образование и наука, Томские новости, ученые наука распознавание речи софт для распознавания машина понимает человека перевод речи Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

Научные сотрудники ТУСУРа исследуют малоизученную шепот алгоритмов по распознаванию речи человека с высокой точностью, сообщает региональный инновационный портал.

Над созданием новых, принципиально отличающихся от существующих, алгоритмов распознавания речи работают на кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС). Исследование томичей направлено на решение из главных задач разработчиков во всем мире – добиться полностью автоматического перевода устного текста любого объема в письменный с высокой точностью, без искажений.

«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», - рассказывает сотрудник КИБЭВС Антон Конев.

Основой распространенных алгоритмов является обучение на большом количестве примеров произнесенных звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесенное. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.

«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается и существующие системы ошибаются очень часто. Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе», - подчеркивает Конев.

Своей задачей ученые кафедры КИБЭВС ТУСУР называют определение более точных параметров звуков, в том числе, с помощью изучения шепотной речи.

«Есть классический термин – форманта – максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений», - добавил Антон Конев.

Исследования показали, что распознавание ударных звуков шепотной речи на основе общепринятых параметров возможно с надежностью не менее 70 %. Точное распознавание речи, которое станет доступно в результате исследований, будет полезно для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов.

Томские новости

Единственный очаг пастереллеза в Томской области ликвидирован — власти

20 марта 2026
Томские новости

Новая выставка «Кодарский уран» откроется в томском музее «Следственная тюрьма НКВД»

27 марта 2026
Томские новости

Луговой клещ расширяет свое присутствие в Западной Сибири — томские ученые

3 апреля 2026
Томские новости

«Томское пиво» в 2025г увеличило чистую прибыль на 13%, выручку — на 2%

5 апреля 2026
Томские новости

В понедельник в Томске будут взрывать лёд

21 марта 2026
Томские новости

Томск возобновил шефство над одноименной подлодкой Тихоокеанского флота

31 марта 2026
Томские новости

Томичи принципиально не пропускают водителей, которые объезжают пробки и вклиниваются в поток

23 марта 2026
Томские новости

Экскурсии по Васюганским болотам: как планируют развивать туризм в крупнейшей экосистеме мира

20 марта 2026
Томские новости

Подросток попал под иномарку в Томске

23 марта 2026