Google анонсировал новую версию своего ИИ-генератора видео — Veo 3, который способен создавать видеоролики со звуковыми эффектами, фоновыми шумами и диалогами. Это заявление подчеркивает конец так называемой «безмолвной эры» ИИ-видео, согласно Google.
Основное отличие Veo 3 от его конкурентов, таких как Sora от OpenAI, заключается в способности встраивать аудио в создаваемые им ролики. Демис Хассабис, генеральный директор Google DeepMind, отметил, что Veo 3 позволяет не только генерировать визуальные элементы, но и добавлять звуковые эффекты и диалоги в соответствии с написанными инструкциями.
Эта возможность открывает новые горизонты для создания видео как в развлекательной, так и в образовательной сфере. Инструкции для генерации видео могут включать описание персонажей, диалогов и окружающей обстановки, что позволит создавать более живые и реалистичные сцены.
Для борьбы с возможной неправомерной эксплуатацией технологии, Google применяет технологию SynthID. Она встраивает водяные знаки в сгенерированные видеоролики, что поможет предотвратить распространение дипфейков.
SynthID уже зарекомендовала себя как эффективное средство борьбы с распространением фейковых новостей и манипулятивных материалов. Это добавляет дополнительный уровень контроля над созданным контентом.
Несмотря на огромный потенциал, у Google неоднозначная репутация в сфере разработки генераторов изображений. Например, в прошлом году компания бела вынуждена приостановить работу модели Imagen 3 из-за жалоб на неточности и искажения исторического контекста. Старательное тестирование и расширение возможностей модели будут критически важны для успеха Veo 3.
Помимо Veo 3, Google анонсировал новую ИИ-модель для генерации изображений — Imagen 4, а также сервис Flow для создания видеороликов. Эти сервисы продолжат развиваться и обеспечивать широкий спектр возможностей для пользователей.
Важно следить за всем спектром услуг Google в сфере ИИ и их развитием, так как они могут существенно изменить медиа-индустрию.
Новый ИИ-генератор видео Veo 3 от Google обещает значительные изменения в мире создания мультимедийного контента. Введение звуковых эффектов и диалогов в генерируемые видео открывает новые возможности и перспективы для пользователей, но одновременно не стоит забывать о юридических и этических аспектах использования таких технологий.
Популярность Veo 3 и других ИИ-сервисов будет зависеть от их способности соответствовать высоким стандартам качества и безопасности, особенно в свете прошлых неудач Google с моделями генерации изображений.
Иногда взросление — это не про ипотеку и карьеру. Это про ночи, когда слышишь, как…
В сети распространяется новость: якобы без привязки мессенджера Max войти на Госуслуги больше нельзя. Мы…
Выйти на пенсию раньше на 5, 10 и даже 15 лет реально — но только…
Недавно появился проект федерального закона № 1139886-8 о признании утратившим силу Закона № 350-ФЗ и…
Пользователям Telegram не грозит автоматическое уголовное преследование даже в случае, если мессенджер будет признан экстремистской…
МВД России вынесло на обсуждение проект, который позволит привлекать к обеспечению правопорядка работников органов внутренних…