«VK Видео» внедряет ИИ для более точных субтитров
Чтобы создать более точные субтитры, которые становятся все более популярны, сервис «VK Видео» задействовал искусственный интеллект. Для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте внедрены новые алгоритмы ИИ. Благодаря этой работе точность анализа и расшифровки увеличилась на 25%.
Кроме того, нейросети сегодня знают уже тысячи новых слов, способны понимать аббревиатуры и мемы, знакомы с именами собственными и профессиональными терминами. В скором времени искусственный интеллект научится разделять речь разных спикеров на отдельные реплики, что пойдет только на пользу субтитрам – они станут понятнее.
В арсенале ИИ для генерации автоматических субтитров есть ML-модели, которые создают текст и синхронизируют его с видео, расставляя знаки препинания. Предусмотрено несколько этапов обработки аудиопотока для повышения точности. В первую очередь нейросеть убирает посторонний шум, распознает речь и перекладывает ее в текст. Затем модели пунктуации и денормализации набор распознанных слов превращают в грамотно изложенный текст. А дальше ИИ синхронизирует его с аудиодорожкой.
На платформе «VK Видео» субтитрами пользуются 11 % людей от всей аудитории сервиса. В последний месяц наблюдается быстрое расширение (на 28 %) доли пользователей, кто применяет субтитры при просмотре. Востребована функция людьми с нарушениями слуха. Удобна она и в случае, когда видео приходится смотреть в беззвучном режиме.
Источник: CNews