18+
18+
РЕКЛАМА

В Томске разработали алгоритм перевода текста литературных произведений в аудиокниги

Образование и наука, ТГУ, Томские новости, ТГУ разработка аудиокнига текст распознавание ошибки ученые В Томске разработали алгоритм перевода текста литературных произведений в аудиокниги

Команда ученых и студентов кафедры теоретических основ информатики ИПМКН Томского государственного университета совместно с компанией «Директ-Медиа» разработали алгоритм LUWRAIN Books для перевода текста литературных произведений в аудиокниги. Разработка позволила снизить коэффициент ошибок при прочтении омонимов и расшифровке сокращений, сообщает пресс-служба ТГУ.

На данный момент LUWRAIN Books размещен в свободном доступе, воспользоваться им может любой желающий. Используя алгоритмы глубокого обучения, он преобразует русскоязычный текст, каким тот встречается в СМИ и художественной литературе, в устную речь. Эта возможность необходима при издании аудиокниг, созданных синтезаторами речи, и озвучивании сайтов. Сложность задачи в том, что только при понимании текста возможна корректная обработка сокращений. Например, когда в тексте есть фрагмент «я получил письмо от о. Петра», человек понимает, что сокращение «о.» в данном случае означает «отца», но для компьютера произвести подобную подстановку невозможно без задействования нейронных сетей.

«При обработке текста мы использовали две нейросети: одна — мелкая, для семантического анализа, нужного для снятия неопределённости сокращений, вторая — глубокая, двунаправленная, для синтаксического анализа текста. Именно вторая определяет, что в предложении „мы положили литературу XIX в. в цифровой ларец“ слово „литература“ стоит в родительном падеже, поэтому при расшифровке будет произнесено „девятнадцатого“», — объясняет доцент кафедры теоретических основ информатики ИПМКН ТГУ Михаил Пожидаев.

Отдельной проблемой при расшифровке текста выступает наличие двух и более сокращений в одном предложении. «Мы забрались на вершину г. Эверест, а потом вернулись в г. Томск» — пример того, как в тексте «г.» используется в двух вариантах: город и гора. В этом случае нейросеть на основе смыслового анализа окружающих слов корректно определяет, как это озвучивать.

«Мы давно над этим работали, но задача крайне непростая, и без современных интеллектуальных алгоритмов такую обработку провести невозможно. Форма на сайте books.luwrain.org может пока работать нестабильно, так как это экспериментальный режим. Но с таким инструментом можно почти целиком исключить использование ручного труда при автоматизации выпуска аудиокниг, который пока необходим в большинстве случаев», — говорит Михаил Пожидаев.

Как утверждают авторы проекта, работу нужно продолжить. Еще предстоит устранить оставшийся процент ошибок и вывести проект на рынок. При этом принципиальна и социальная составляющая — для незрячих людей сервис и дальше будет работать бесплатно, его эффективность уже опробовали в школе-интернате для детей с нарушениями зрения.

Подписывайтесь на наш телеграм-канал «Томский Обзор».

Томские новости

Новый первый заммэра Томска из Омска вступил в должность

23 октября 2024
Томские новости

Суд прекратил дело о банкротстве томского областного ДРСУ, инициированное банком «Уралсиб»

13 ноября 2024
Томские новости

Электрический орган из томского костела перевезли на новое место

25 октября 2024
Томские новости

Депутаты гордумы запретили снос ценных домов в историческом центре Томска

5 ноября 2024
Томские новости

Покусавший военного полицейского рядовой в Томске получил 5 лет колонии

15 ноября 2024
Томские новости

В Томске пальцы рабочего застряли в шлифовальной машинке

23 октября 2024
Томские новости

Свыше 130 тысяч сибиряков получили новые цифровые возможности

29 октября 2024
Томские новости

Жители более 3,9 тыс. домов останутся без воды из-за аварии на водопроводе в Томске

6 ноября 2024
Томские новости

В Томске починили качели на ул. Жуковского

6 ноября 2024