Дослідниця назвала «просторове мислення» головною перепоною для ШІ
ШІ поки не здатен повною мірою розуміти фізичний світ. Наразі це головна проблема технології, заявила професорка компʼютерних наук Стенфордського університету Фей-Фей Лі.
«Провідні технології ШІ на кшталт великих мовних моделей (LLM) змінили спосіб нашого доступу до абстрактних знань і роботи з ними. Втім, вони залишаються майстрами лише на словах: красномовними, але недосвідченими, обізнаними, однак необґрунтованими», — вважає Лі.
На думку дослідниці, поява «просторового інтелекту» змінить те, як люди «створюють і взаємодіють із реальними та віртуальними світами, здійснивши революцію в літературі, мистецтві, робототехніці, науці й не тільки».
Створення такої технології вимагає навчання моделей не лише на «мові», а й на фізичних властивостях світу.
Лі стверджує, що штучний інтелект швидко наближається до меж можливостей текстового навчання, і зрештою його прогрес залежатиме від «моделей світу» — нового типу генеративного ШІ, який має розв’язувати принципово інший клас завдань, ніж LLM.
AI’s next frontier is Spatial Intelligence, a technology that will turn seeing into reasoning, perception into action, and imagination into creation. But what is it? Why does it matter? How do we build it? And how can we use it?
Today, I want to share with you my thoughts on… pic.twitter.com/L0bnJcCUqc
— Fei-Fei Li (@drfeifei) November 10, 2025
«Такі системи мають генерувати просторово узгоджені світи, що підкоряються фізичним законам, обробляти багатомодальні вхідні дані — від зображень до дій — і передбачати еволюцію цих світів», — пояснює Лі.
За баченням професорки, просторовий інтелект — це «межа за межами мови — здатність створювати взаємозв’язок».
Ідея «моделей світу»
Концепція з’явилася на початку 1940-х у працях шотландського філософа й психолога Кеннета Крейка в галузі когнітивної науки.
Ідея знову постала в сучасному ШІ-просторі у 2018 році після статті Девіда Ха та Юргена Шмідхубера про те, що нейромережа може навчитися й відтворити компактну внутрішню модель довкілля та використовувати її як симулятор для планування й керування.
Утім, розв’язання задачі потребує складних систем, здатних зберігати просторову пам’ять і моделювати сцени більш ніж у двох вимірах.
У вересні компанія Лі, World Labs, випустила бета-версію Marble — ранньої «моделі світу», що створює інтерактивні тривимірні середовища за допомогою текстових або графічних підказок.
Користувачі могли пересуватися згенерованими середовищами без обмежень у часі чи підвантаження сцен, а навколишнє середовище залишалося єдиним — не змінювалося й не розпадалося.
«Наступним кроком розвитку ШІ стане просторовий інтелект — технологія, яка перетворить бачення на міркування, сприйняття — на дію, а уяву — на творчість», — зазначила Лі, назвавши Marble лише першим етапом.
Нагадаємо, у жовтні Nvidia представила систему для підключення квантових комп’ютерів до ШІ-чіпів компанії. Технологія істотно прискорить обробку даних і відкриє нові можливості для досліджень у медицині та матеріалознавстві.