Представители томского вуза разработают способы определения искусственно созданных текстов в Интернете
Студенты и специалисты ТУСУР планируют создать модели и алгоритмы, которые помогут не только определить текст, автоматически составленный специальной компьютерной программой, но и установить автора анонимного электронного послания по стилю написания.
Как уточняют в пресс-службе ЦИОС-ТУСУР, проблема искусственно созданных компьютерной программой текстов, по мнению разработчиков, в настоящее время очень актуальна, так как для многих Интернет стал основным источником информации. В Сети люди читают новости, пишут комментарии, сами создают блоги.
"Долгое время Интернет воспринимался как источник информации, наиболее объективно отражающий картину мира. Но уже сегодня очевидно, что это не совсем так. Существуют компьютерные системы, способные искусственно создавать тексты, обладающие правдоподобием, и есть системы, которые переписывают тексты. То есть достаточно написать одно сообщение, а подобные системы генерируют на его основе несколько якобы разных текстов и запускают от разных пользователей. Так можно в чьих-то интересах искусственно поднять не очень значимую тему. Мы разрабатываем механизм выявления таких текстов, позволяющий определить, что текст или полностью не принадлежит авторству человека, или поправлен автоматически", - пояснил профессор кафедры комплексной информационной безопасности электронно-вычислительных систем ТУСУР Роман Мещеряков.
Оригинальные модели и алгоритмы, которые тусуровцы планируют создать, должны будут выявлять стилистические особенности текста. Формальные критерии, определяющие создан текст человеком или компьютером, предстоит разработать вместе со специалистами-гуманитариями: к работе над проектом уже присоединились сотрудники кафедры русского языка и общего языкознания филологического факультета НИ ТГУ.
"С помощью таких моделей и алгоритмов мы сможем решить ряд важных вопросов помимо определения искусственно созданного текста. Возможно будет установить автора анонимки, присланной по электронной почте, или определить, набирал ли человек предсмертную записку на компьютере сам или это сделал преступник. В этих случаях программа будет искать стилистические закономерности в разных текстах одного и того же человека, и, при отклонении от нормы, указывать на это", - уточнил , - добавляет Роман Мещеряков.
Пока проект находится в стадии разработки, но подобных работающих аналогов к настоящему времени нет и в мире, хотя многие специалисты активно занимаются поисками решения актуальной проблемы.