Главная > IT > «VK Видео» внедряет ИИ для более точных субтитров

«VK Видео» внедряет ИИ для более точных субтитров

17.09.2024 IT

Чтобы создать более точные субтитры, которые становятся все более популярны, сервис «VK Видео» задействовал искусственный интеллект. Для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте внедрены новые алгоритмы ИИ. Благодаря этой работе точность анализа и расшифровки увеличилась на 25%.

Кроме того, нейросети сегодня знают уже тысячи новых слов, способны понимать аббревиатуры и мемы, знакомы с именами собственными и профессиональными терминами. В скором времени искусственный интеллект научится разделять речь разных спикеров на отдельные реплики, что пойдет только на пользу субтитрам – они станут понятнее.

В арсенале ИИ для генерации автоматических субтитров есть ML-модели, которые создают текст и синхронизируют его с видео, расставляя знаки препинания. Предусмотрено несколько этапов обработки аудиопотока для повышения точности. В первую очередь нейросеть убирает посторонний шум, распознает речь и перекладывает ее в текст. Затем модели пунктуации и денормализации набор распознанных слов превращают в грамотно изложенный текст. А дальше ИИ синхронизирует его с аудиодорожкой.

На платформе «VK Видео» субтитрами пользуются 11 % людей от всей аудитории сервиса. В последний месяц наблюдается быстрое расширение (на 28 %) доли пользователей, кто применяет субтитры при просмотре. Востребована функция людьми с нарушениями слуха. Удобна она и в случае, когда видео приходится смотреть в беззвучном режиме.

Источник: CNews