Google DeepMind представив нові ШІ-генератори відео та зображень
DeepMind — орієнтований на ШІ підрозділ Google — анонсував нову модель для генерації відео Veo 2.
Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. 🎥
— Google DeepMind (@GoogleDeepMind) December 16, 2024
We’re also releasing an improved version of our text-to-image model, Imagen 3 – available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4
Нейромережа здатна:
- створювати відео з роздільною здатністю до 4K;
- розуміти вимоги до управління камерою в промптах;
- добре відтворювати правила фізичного світу та реалістичний вираз облич людини.
«Під час прямих порівнянь результатів, проведених експертами, Veo 2 віддали перевагу порівняно з іншими передовими моделями генерації відео», — зазначили DeepMind.
В експериментальному інструменті Google VideoFX для створення відео наразі доступні ролики з роздільною здатністю до 720p і тривалістю до восьми секунд. Повний функціонал Veo 2 надано лише обмеженому числу користувачів, а розширений запуск планується на наступний рік.
Співробітники Google також поліпшили можливості генератора зображень Imagen 3. Нейромережа отримала здатність застосовувати різні стилі мистецтва на кшталт реалізму, фентезі та інших.
Veo 2 is able to:
— Google DeepMind (@GoogleDeepMind) December 16, 2024
▪️ Create videos at resolutions up to 4k
▪️ Understand camera controls in prompts, such as wide shot, POV and drone shots
▪️ Better recreate real-world physics and realistic human expression
In head-to-head comparisons of outputs by human raters, it was… pic.twitter.com/doC3GwY30z
Також вона точніше створює картинку за промптом і генерує більш яскраві та збалансовані візуальні ефекти.
Нагадаємо, у грудні Google випустила нову модель Gemini 2.0, інструмент Deep Research для міркувань та ШІ-агента Project Mariner — він здатний виконувати дії на комп’ютері замість користувача.