18+
18+
РЕКЛАМА

Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

IT, Образование и наука, Томские новости, ученые наука распознавание речи софт для распознавания машина понимает человека перевод речи Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

Научные сотрудники ТУСУРа исследуют малоизученную шепот алгоритмов по распознаванию речи человека с высокой точностью, сообщает региональный инновационный портал.

Над созданием новых, принципиально отличающихся от существующих, алгоритмов распознавания речи работают на кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС). Исследование томичей направлено на решение из главных задач разработчиков во всем мире – добиться полностью автоматического перевода устного текста любого объема в письменный с высокой точностью, без искажений.

«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», - рассказывает сотрудник КИБЭВС Антон Конев.

Основой распространенных алгоритмов является обучение на большом количестве примеров произнесенных звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесенное. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.

«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается и существующие системы ошибаются очень часто. Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе», - подчеркивает Конев.

Своей задачей ученые кафедры КИБЭВС ТУСУР называют определение более точных параметров звуков, в том числе, с помощью изучения шепотной речи.

«Есть классический термин – форманта – максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений», - добавил Антон Конев.

Исследования показали, что распознавание ударных звуков шепотной речи на основе общепринятых параметров возможно с надежностью не менее 70 %. Точное распознавание речи, которое станет доступно в результате исследований, будет полезно для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов.

Томские новости

В Томской области оштрафовали паблик во «ВКонтакте» за отсутствие пометки о рекламе

11 апреля 2024
Томские новости

Часть жителей Ленинского района Томска до вечера осталась без воды из-за аварии на водопроводных сетях

15 апреля 2024
Томские новости

Ледоход на Томи прошел территорию Томска, уровень воды в реке вырос почти на метр

19 апреля 2024
Томские новости

После вмешательства прокуратуры запустили авиарейс «Томск — Кедровый»

24 апреля 2024
Томские новости

Томичам представят книгу «Картинные девушки» об известных художниках и их музах

19 апреля 2024
Томские новости

Хроники томского парламента.
Четвертый созыв. 2007-2011 годы.
Многопартийная Дума

15 апреля 2024
Томские новости

В ближайшие дни в Томске изменится схема движения транспорта

6 мая 2024
Томские новости

Сегодня в Томске начали расконсервировать фонтаны

20 апреля 2024
Томские новости

Уровень воды в Томи в районе Томска снизился

26 апреля 2024