08.02.2024

Новости

Искусственный интеллект в книжной отрасли: заменит ли он чтецов?

О внедрении нейросетей в области аудиокниг, перспективах и барьерах рассказывает Сергей Анурьев, генеральный директор группы компаний "ЛитРес".

Комфортен ли слушателям "голос" ИИ

Сейчас пока рано давать окончательную оценку влияния технологий синтеза речи на качество речи в части озвучивания книг. Важно понимать, что технологии синтеза речи, те, о которых мы на сегодняшний день можем говорить, постоянно развиваются и завтра они, я верю, выйдут на новый уровень. Ведь сегодня в их развитие вовлечено несколько крупных игроков. Наибольших успехов на данный момент, на мой взгляд, в технологиях на основе машинного обучения и нейросетей добились Яндекс с технологией Яндекс SpeechKit, Сбер с SaluteSpeech, а также Тинькофф (Tinkoff VoiceKit) и МТС (MTS AI). Эти игроки показывают достаточно хороший результат, и здесь у каждого решения есть свои особенности, плюсы и минусы, так как они по-разному решают проблемы интонирования, расстановки ударений, естественного звучания речи. В итоге все напрямую зависит от того, какая технология использована. Например, сейчас мы в ГК "ЛитРес" работаем на основе Яндекс SpeechKit, и эта технология показывает хороший результат, который мы можем оценить по отзывам наших пользователей.

Если говорить о количественных оценках качества синтеза речи ИИ, то мы отслеживаем для себя два параметра: отношение пользовательских оценок по искусственно озвученным книгам к оценкам студийных аудиокниг и отношение пользовательских оценок по искусственно озвученным книгам к оценкам пользователей их текстовых версий

Первый параметр, на наш взгляд, показывает отношение пользователей в среднем к ИИ озвучиванию книг относительно качественных студийных записей. При этом мы отдаем себе отчет, что в ИИ "озвучку" заведомо попадают в основном менее популярные произведения, поэтому и оценка ИИ книг будет ниже, чем у студийных записей. Сейчас средняя оценка ИИ озвученных книг 4,46 при 4,64 у студийных записей.

Второй показатель позволяет оценить влияние ИИ озвучки на качество восприятия текста читателем. То есть если оценки ИИ озвученной аудиокниги в среднем статистически не отличаются от оценок книги в текстовом формате, то можно говорить о том, что ИИ не ухудшил восприятие книги читателем. В среднем оценка ИИ книг составляет те же 4,46, при том что их текстовые оригиналы оценены читателями на уровне 4,6.

Полный текст статьи размещен на сайте «Российской газеты»: https://rg.ru/2024/02/08/iskusstvennyj-intellekt-v-knizhnoj-otrasli-zamenit-li-on-chtecov.html

Источник: rg.ru



Еще новости / Назад к новостям