Дослідниця назвала «просторове мислення» головною перепоною для ШІ

ШІ поки не здатен повною мірою розуміти фізичний світ. Наразі це головна проблема технології, заявила професорка компʼютерних наук Стенфордського університету Фей-Фей Лі.

«Провідні технології ШІ на кшталт великих мовних моделей (LLM) змінили спосіб нашого доступу до абстрактних знань і роботи з ними. Втім, вони залишаються майстрами лише на словах: красномовними, але недосвідченими, обізнаними, однак необґрунтованими», — вважає Лі. 

На думку дослідниці, поява «просторового інтелекту» змінить те, як люди «створюють і взаємодіють із реальними та віртуальними світами, здійснивши революцію в літературі, мистецтві, робототехніці, науці й не тільки».

Створення такої технології вимагає навчання моделей не лише на «мові», а й на фізичних властивостях світу. 

Лі стверджує, що штучний інтелект швидко наближається до меж можливостей текстового навчання, і зрештою його прогрес залежатиме від «моделей світу» — нового типу генеративного ШІ, який має розв’язувати принципово інший клас завдань, ніж LLM.

«Такі системи мають генерувати просторово узгоджені світи, що підкоряються фізичним законам, обробляти багатомодальні вхідні дані — від зображень до дій — і передбачати еволюцію цих світів», — пояснює Лі. 

За баченням професорки, просторовий інтелект — це «межа за межами мови — здатність створювати взаємозв’язок».

Ідея «моделей світу»

Концепція з’явилася на початку 1940-х у працях шотландського філософа й психолога Кеннета Крейка в галузі когнітивної науки. 

Ідея знову постала в сучасному ШІ-просторі у 2018 році після статті Девіда Ха та Юргена Шмідхубера про те, що нейромережа може навчитися й відтворити компактну внутрішню модель довкілля та використовувати її як симулятор для планування й керування.

Утім, розв’язання задачі потребує складних систем, здатних зберігати просторову пам’ять і моделювати сцени більш ніж у двох вимірах.

У вересні компанія Лі, World Labs, випустила бета-версію Marble — ранньої «моделі світу», що створює інтерактивні тривимірні середовища за допомогою текстових або графічних підказок.

Приклад роботи Marble. Джерело: World Labs.

Користувачі могли пересуватися згенерованими середовищами без обмежень у часі чи підвантаження сцен, а навколишнє середовище залишалося єдиним — не змінювалося й не розпадалося.

Приклад роботи Marble. Джерело: World Labs.

«Наступним кроком розвитку ШІ стане просторовий інтелект — технологія, яка перетворить бачення на міркування, сприйняття — на дію, а уяву — на творчість», — зазначила Лі, назвавши Marble лише першим етапом.

Нагадаємо, у жовтні Nvidia представила систему для підключення квантових комп’ютерів до ШІ-чіпів компанії. Технологія істотно прискорить обробку даних і відкриє нові можливості для досліджень у медицині та матеріалознавстві. 

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK