Дослідниця назвала «просторове мислення» головною перепоною для ШІ

11.11.2025 ForkLog UA

ШІ поки не здатен повною мірою розуміти фізичний світ. Наразі це головна проблема технології, заявила професорка компʼютерних наук Стенфордського університету Фей-Фей Лі.

«Провідні технології ШІ на кшталт великих мовних моделей (LLM) змінили спосіб нашого доступу до абстрактних знань і роботи з ними. Втім, вони залишаються майстрами лише на словах: красномовними, але недосвідченими, обізнаними, однак необґрунтованими», — вважає Лі.

На думку дослідниці, поява «просторового інтелекту» змінить те, як люди «створюють і взаємодіють із реальними та віртуальними світами, здійснивши революцію в літературі, мистецтві, робототехніці, науці й не тільки».

Створення такої технології вимагає навчання моделей не лише на «мові», а й на фізичних властивостях світу.

Лі стверджує, що штучний інтелект швидко наближається до меж можливостей текстового навчання, і зрештою його прогрес залежатиме від «моделей світу» — нового типу генеративного ШІ, який має розв’язувати принципово інший клас завдань, ніж LLM.

AI’s next frontier is Spatial Intelligence, a technology that will turn seeing into reasoning, perception into action, and imagination into creation. But what is it? Why does it matter? How do we build it? And how can we use it?

Today, I want to share with you my thoughts on… pic.twitter.com/L0bnJcCUqc

— Fei-Fei Li (@drfeifei) November 10, 2025

«Такі системи мають генерувати просторово узгоджені світи, що підкоряються фізичним законам, обробляти багатомодальні вхідні дані — від зображень до дій — і передбачати еволюцію цих світів», — пояснює Лі.

За баченням професорки, просторовий інтелект — це «межа за межами мови — здатність створювати взаємозв’язок».

Ідея «моделей світу»

Концепція з’явилася на початку 1940-х у працях шотландського філософа й психолога Кеннета Крейка в галузі когнітивної науки.

Ідея знову постала в сучасному ШІ-просторі у 2018 році після статті Девіда Ха та Юргена Шмідхубера про те, що нейромережа може навчитися й відтворити компактну внутрішню модель довкілля та використовувати її як симулятор для планування й керування.

Утім, розв’язання задачі потребує складних систем, здатних зберігати просторову пам’ять і моделювати сцени більш ніж у двох вимірах.

У вересні компанія Лі, World Labs, випустила бета-версію Marble — ранньої «моделі світу», що створює інтерактивні тривимірні середовища за допомогою текстових або графічних підказок.

https://forklog.com/wp-content/uploads/img-8f932a11a096d457-9268366690089015.mp4

Приклад роботи Marble. Джерело: World Labs.

Користувачі могли пересуватися згенерованими середовищами без обмежень у часі чи підвантаження сцен, а навколишнє середовище залишалося єдиним — не змінювалося й не розпадалося.

https://forklog.com/wp-content/uploads/img-4cfd8a62f88a8e5d-9268363295743660.mp4

Приклад роботи Marble. Джерело: World Labs.

«Наступним кроком розвитку ШІ стане просторовий інтелект — технологія, яка перетворить бачення на міркування, сприйняття — на дію, а уяву — на творчість», — зазначила Лі, назвавши Marble лише першим етапом.

Нагадаємо, у жовтні Nvidia представила систему для підключення квантових комп’ютерів до ШІ-чіпів компанії. Технологія істотно прискорить обробку даних і відкриє нові можливості для досліджень у медицині та матеріалознавстві.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Китайська 360 представила відповідь на Mythos 5 від Anthropic

Каліфорнія відкриє держорганам доступ до Claude

Meta презентувала ШІ для відновлення набраного тексту зі записів мозкової активності

Аналітики попереджають: ШІ-бум несе ризики для фінансової системи

ЗМІ: OpenAI обмежить реліз GPT-5.6 на запит уряду США

Anthropic звинуватила пов’язаних з Alibaba операторів у дистиляції Claude

Пентагон розширив роль ШІ у військовій стратегії

«Життя» токенів на Pump․fun скоротилося до доби

У Бристолі вимкнули ШІ-моделі для оцінки ризику злочинів проти дітей через помилки