Подразделение Google DeepMind анонсировало Veo 2 — новый генератор видео на основе искусственного интеллекта. Данный инструмент способен создавать видеоконтент в 4K разрешении (4096 × 2160 пикселей) и длительностью до двух минут. Это означает, что Veo 2 превосходит OpenAI Sora в четыре раза по качеству изображения и в шесть раз по времени видеозаписи.
В настоящее время данное преимущество носит преимущественно теоретический характер: протестировать Veo 2 можно только на экспериментальной площадке VideoFX, где разрешение ограничивается 720p, а продолжительность видео составляет всего 8 секунд. В отличие от этого, версия генератора OpenAI Sora, доступная для пользователей, предлагает разрешение 1080p и 20 секунд видео. Чтобы начать использование VideoFX, необходимо записаться в очередь, хотя на этой неделе Google пообещала увеличить количество пользователей. В будущем Veo 2 станет доступен на платформе для бизнес-пользователей Vertex AI, однако точные сроки этого события в Google пока не уточнили.
Veo 2 создает видео на основе текстовых подсказок, которые могут быть дополнены изображениями. В отличие от первой версии, новая модель демонстрирует лучшее понимание физики, а изображение стало заметно четче. Также значительно улучшены механизмы перемещения виртуальной камеры. Veo 2 более реалистично воспроизводит движение, например, процесс наливающегося в кружку кофе, а также лучше передает свойства света, включая тени и отражения. Кроме того, она правдоподобно имитирует различные линзы виртуальной камеры и кинематографические эффекты.
Горячие темы