18+
18+
РЕКЛАМА

В Томске разработали алгоритм перевода текста литературных произведений в аудиокниги

Образование и наука, ТГУ, Томские новости, ТГУ разработка аудиокнига текст распознавание ошибки ученые В Томске разработали алгоритм перевода текста литературных произведений в аудиокниги

Команда ученых и студентов кафедры теоретических основ информатики ИПМКН Томского государственного университета совместно с компанией «Директ-Медиа» разработали алгоритм LUWRAIN Books для перевода текста литературных произведений в аудиокниги. Разработка позволила снизить коэффициент ошибок при прочтении омонимов и расшифровке сокращений, сообщает пресс-служба ТГУ.

На данный момент LUWRAIN Books размещен в свободном доступе, воспользоваться им может любой желающий. Используя алгоритмы глубокого обучения, он преобразует русскоязычный текст, каким тот встречается в СМИ и художественной литературе, в устную речь. Эта возможность необходима при издании аудиокниг, созданных синтезаторами речи, и озвучивании сайтов. Сложность задачи в том, что только при понимании текста возможна корректная обработка сокращений. Например, когда в тексте есть фрагмент «я получил письмо от о. Петра», человек понимает, что сокращение «о.» в данном случае означает «отца», но для компьютера произвести подобную подстановку невозможно без задействования нейронных сетей.

«При обработке текста мы использовали две нейросети: одна — мелкая, для семантического анализа, нужного для снятия неопределённости сокращений, вторая — глубокая, двунаправленная, для синтаксического анализа текста. Именно вторая определяет, что в предложении „мы положили литературу XIX в. в цифровой ларец“ слово „литература“ стоит в родительном падеже, поэтому при расшифровке будет произнесено „девятнадцатого“», — объясняет доцент кафедры теоретических основ информатики ИПМКН ТГУ Михаил Пожидаев.

Отдельной проблемой при расшифровке текста выступает наличие двух и более сокращений в одном предложении. «Мы забрались на вершину г. Эверест, а потом вернулись в г. Томск» — пример того, как в тексте «г.» используется в двух вариантах: город и гора. В этом случае нейросеть на основе смыслового анализа окружающих слов корректно определяет, как это озвучивать.

«Мы давно над этим работали, но задача крайне непростая, и без современных интеллектуальных алгоритмов такую обработку провести невозможно. Форма на сайте books.luwrain.org может пока работать нестабильно, так как это экспериментальный режим. Но с таким инструментом можно почти целиком исключить использование ручного труда при автоматизации выпуска аудиокниг, который пока необходим в большинстве случаев», — говорит Михаил Пожидаев.

Как утверждают авторы проекта, работу нужно продолжить. Еще предстоит устранить оставшийся процент ошибок и вывести проект на рынок. При этом принципиальна и социальная составляющая — для незрячих людей сервис и дальше будет работать бесплатно, его эффективность уже опробовали в школе-интернате для детей с нарушениями зрения.

Подписывайтесь на наш телеграм-канал «Томский Обзор».

Томские новости

Писательница Марина Москвина стала автором Тотального диктанта — 2025

9 сентября 2024
Томские новости

Никто не заявился на III этап ремонта участка альтернативной трассы из Томска в Новосибирск

9 сентября 2024
Томские новости

В Томске у Драмтеатра появилась шишка с международной выставки-форума «Россия»

6 сентября 2024
Томские новости

В Томске пройдет спецгашение к выходу новой марки с дымковской игрушкой

3 сентября 2024
Томские новости

На Васюганских болотах в рамках совместного проекта Пушкинского музея и ТГУ появится масштабная световая инсталляция

26 сентября 2024
Томские новости

«Автодорстрой» из СЦЛ почти за миллиард рублей отремонтирует 18 км альтернативной трассы из Томска в Новосибирск

19 сентября 2024
Томские новости

На днях томичей ждут заморозки

9 сентября 2024
Томские новости

Томичей приглашают узнать о жизни и удивительных приключениях Петра Макушина

4 сентября 2024
Томские новости

Томичей приглашают на большую зооярмарку в музейный дворик

4 сентября 2024