Google анонсировал новую версию своего ИИ-генератора видео — Veo 3, который способен создавать видеоролики со звуковыми эффектами, фоновыми шумами и диалогами. Это заявление подчеркивает конец так называемой «безмолвной эры» ИИ-видео, согласно Google.
Основное отличие Veo 3 от его конкурентов, таких как Sora от OpenAI, заключается в способности встраивать аудио в создаваемые им ролики. Демис Хассабис, генеральный директор Google DeepMind, отметил, что Veo 3 позволяет не только генерировать визуальные элементы, но и добавлять звуковые эффекты и диалоги в соответствии с написанными инструкциями.
Эта возможность открывает новые горизонты для создания видео как в развлекательной, так и в образовательной сфере. Инструкции для генерации видео могут включать описание персонажей, диалогов и окружающей обстановки, что позволит создавать более живые и реалистичные сцены.
Для борьбы с возможной неправомерной эксплуатацией технологии, Google применяет технологию SynthID. Она встраивает водяные знаки в сгенерированные видеоролики, что поможет предотвратить распространение дипфейков.
SynthID уже зарекомендовала себя как эффективное средство борьбы с распространением фейковых новостей и манипулятивных материалов. Это добавляет дополнительный уровень контроля над созданным контентом.
Несмотря на огромный потенциал, у Google неоднозначная репутация в сфере разработки генераторов изображений. Например, в прошлом году компания бела вынуждена приостановить работу модели Imagen 3 из-за жалоб на неточности и искажения исторического контекста. Старательное тестирование и расширение возможностей модели будут критически важны для успеха Veo 3.
Помимо Veo 3, Google анонсировал новую ИИ-модель для генерации изображений — Imagen 4, а также сервис Flow для создания видеороликов. Эти сервисы продолжат развиваться и обеспечивать широкий спектр возможностей для пользователей.
Важно следить за всем спектром услуг Google в сфере ИИ и их развитием, так как они могут существенно изменить медиа-индустрию.
Новый ИИ-генератор видео Veo 3 от Google обещает значительные изменения в мире создания мультимедийного контента. Введение звуковых эффектов и диалогов в генерируемые видео открывает новые возможности и перспективы для пользователей, но одновременно не стоит забывать о юридических и этических аспектах использования таких технологий.
Популярность Veo 3 и других ИИ-сервисов будет зависеть от их способности соответствовать высоким стандартам качества и безопасности, особенно в свете прошлых неудач Google с моделями генерации изображений.
Какие льготы действуют для детей при поездках по России на поездах дальнего следования, как посчитать…
Верховный Суд РФ отменил постановление кассационной инстанции, которым уголовное дело в отношении руководителя организации по…
Росреестр утвердил новый порядок взимания и возврата платы за предоставление сведений из Единого государственного реестра…
До 15 мая 2026 учреждения публичного сектора должны разместить сведения о среднемесячных выплатах за 2025…
Правительство уточнило порядок одобрения программ повышения экологической эффективности. С 1 декабря 2026 для обмена документами…
Кабмин изменил правила проведения экзамена на получение водительских прав. Теперь практическую часть назначают не позднее…