Нова відеомодель Runway обійшла Veo 3 і Sora 2 Pro

ШІ-стартап Runway випустив нову відеомодель Gen-4.5, яка перевершила аналогічні рішення конкурентів у незалежному тестуванні.

Інструмент дозволяє генерувати відеоролики з високою чіткістю на основі текстових промптів, що описують бажаний рух і дію. Компанія підкреслила, що модель добре розуміє фізику, рухи людини та камери, а також причинно-наслідкові зв’язки.

«Gen-4.5 — ультрасучасна технологія, яка встановлює новий стандарт якості руху під час генерації відео, оперативності та візуальної достовірності», — заявили розробники.

Gen-4.5 посіла перше місце в рейтингу Video Arena, який веде незалежна компанія Artificial Analysis. Для ранжування люди порівнюють результати двох моделей і голосують за кращий варіант. Вони заздалегідь не знають, які компанії стоять за ШІ.

Veo 3 від Google посіла друге місце у Video Arena, Sora 2 Pro від OpenAI — сьоме.

«Нам вдалося обійти корпорації з оборотом у трильйони доларів командою зі 100 людей», — підкреслив CEO Runway Крістобаль Валенсуела.

Модель здатна розуміти і виконувати складні послідовні інструкції. Користувач може задати детальну хореографію камери, композиції сцен, точний таймінг подій і тонкі зміни атмосфери в одному промпті.

«Gen-4.5 досягає безпрецедентного рівня фізичної та візуальної точності. Об’єкти рухаються з реалістичною масою та імпульсом. Поверхні поводяться так, як у реальному світі. Закони фізики можуть як дотримуватися, так і ігноруватися — залежно від вашого бажання», — підкреслили розробники.

Нейромережа працює не без помилок. Можливі збої в причинно-наслідкових зв’язках і сталісті об’єктів. Команда працює над їх усуненням.

Модель стає доступною до кінця тижня через платформу компанії, API і деяких партнерів.

Відеокарти Nvidia

Gen-4.5 розробили на відеокартах компанії Nvidia. Вони застосовувалися на всіх етапах: від початкових досліджень до попереднього навчання. Компанія «тісно співпрацювала» з американським чипмейкером, щоб «розширити межі можливого в оптимізації, ефективності навчання та швидкості інференсу».

Робота нейромережі також здійснюється на графічних процесорах Nvidia із серій Hopper і Blackwell, «забезпечуючи оптимізовану продуктивність без шкоди для якості».

Нагадаємо, у жовтні стартап OpenAI і техгігант Google представили оновлені версії ШІ-моделей для генерації відео.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK
Exit mobile version