Google представила ШІ-інновації: NotebookLM, «мозок» для роботів і шопінг
Компанія Google представила низку нових рішень у сфері агентного ШІ. Серед них: режим глибоких досліджень у NotebookLM, «мозок для роботів» SIMA 2 та інструменти для шопінгу.
Deep Research у NotebookLM
Google оновила ШІ-асистента для нотаток NotebookLM. Додано інструмент для спрощення складних досліджень і підтримку додаткових типів файлів.
Сервіс запустив Deep Research — рішення для автоматизації онлайн-пошуку. Компанія стверджує, що він працює як окремий дослідник зі здатністю підготувати розгорнутий звіт або порекомендувати релевантні статті, наукові роботи та сайти.
Deep Research отримує запит, складає дослідницький план і переглядає вебресурси. За кілька хвилин він надає звіт, заснований на джерелах, який можна відразу додати до блокнота.
Функція працює у фоновому режимі — паралельно можна виконувати інші задачі.
Інструмент доступний через пошук. Можна обрати стиль дослідження: детальний Deep Research або швидкий Fast Research.
Додатково в NotebookLM з’явилась підтримка Google Sheets, файлів із Drive у вигляді URL, PDF із Google Drive та документів Microsoft Word.
Оновлення з’являться протягом тижня.
NotebookLM — ШІ-асистент для нотаток, досліджень і роботи з документами від Google. Він дозволяє завантажувати матеріали — PDF, статті, таблиці, зображення, посилання, юридичні документи, лекції — та формувати структуровану базу знань.
Сервіс запустили 2023 року. Відтоді його можливості поступово розширюються завдяки штучному інтелекту. На початку 2025 року з’явилася функція Video Overviews, яка перетворює складний мультимедійний матеріал на зрозумілі візуальні презентації.
У травні NotebookLM став доступним на Android та iOS.
Майбутнє роботів
Google продовжує розвивати напрям «мозку» для робототехніки.
Підрозділ DeepMind представив SIMA 2 — нове покоління універсального ШІ-агента. Він «виходить за рамки простого виконання інструкцій», починає розуміти довкілля та взаємодіяти з ним.
Перша версія SIMA навчалася на сотнях годин геймплейних відеозаписів, щоб опанувати гру в різні 3D-ігри як людина. Її представили в березні 2024 року. Модель могла виконувати базові команди в різних віртуальних світах, але складні задачі — лише у 31% випадків.
SIMA 2 спирається на мовні та аналітичні можливості Gemini і працює на базі версії 2.5 flash-lite. Точність зросла до 65%.
«SIMA 2 — якісний стрибок порівняно з SIMA 1. Це більш універсальний агент. Він уміє виконувати складні завдання в новому середовищі, у якому раніше не був», — сказав на пресбрифінгу старший науковий співробітник DeepMind Джо Маріно.
Агент здатен до самонавчання — покращує свої навички на основі власного досвіду. Це крок у бік більш універсальних роботів і систем, зазначив Маріно.
Крок до AGI
Дослідники ШІ-підрозділу Google наголосили, що робота над так званими «втіленими агентами» критично важлива для розвитку загального інтелекту. Подібний помічник має вміти взаємодіяти з фізичним і віртуальними світами через тіло — як людина або робот.
Невтілений асистент може керувати календарем, робити нотатки або виконувати код, пояснив Маріно.
Старша наукова співробітниця DeepMind із нейробіологічним бекграундом Джейн Ван підкреслила, що SIMA 2 виходить далеко за межі звичайної ігрової поведінки.
«Ми вимагаємо від нього справді розуміти, що відбувається, що від нього хочуть, і реагувати розсудливо і по суті. Це насправді доволі складно», — сказала вона.
Інтеграція Gemini дозволила SIMA 2 подвоїти показники попередньої версії. Модель поєднує розвинені мовні та аналітичні можливості ШІ з навичками «втіленої» взаємодії, набутими у процесі навчання.
Навчили грати у відеоігри
Маріно продемонстрував SIMA 2 у грі No Man’s Sky. Агент описував оточення — кам’янисту поверхню планети — і визначав свої наступні дії. Для внутрішніх міркувань він використовував Gemini.
В іншій грі помічника попросили підійти до будинку кольору стиглого томата. ШІ показав процес аналізу: «він червоний, отже, треба йти до будинку відповідного кольору». Потім асистент почав рухатися в потрібному напрямку.
Завдяки застосуванню Gemini ШІ-агент розуміє інструкції навіть у вигляді емодзі. Команда на кшталт «сокира + дерево» змусить його рубати дерево.
SIMA 2 орієнтується у фотореалістичних світах, згенерованих за допомогою Genie. Він коректно розпізнає об’єкти на кшталт лавок, дерев, метеликів і здатен взаємодіяти з ними.
Процес самонавчання
Завдяки Gemini нова версія SIMA здатна до самонавчання майже без участі людини, використовуючи надані дані лише як базовий орієнтир.
Команда поміщає агента в нове середовище, а окрема модель генерує для нього завдання.
Generalization ☂️
SIMA 2 is now far better at carrying out detailed instructions, even in worlds it’s never seen before.
It can transfer learned concepts like “mining” in one game and apply it to “harvesting” in another – connecting the dots between similar tasks.
It even… pic.twitter.com/ANldQVWFd4
— Google DeepMind (@GoogleDeepMind) November 13, 2025
SIMA 2 аналізує свої недоліки та поступово покращує навички. По суті, це навчання методом спроб і помилок, але без участі людини: роль наставника виконує інша система штучного інтелекту.
У DeepMind вважають, що нове рішення — крок до створення по-справжньому універсальних роботів.
«Системі для виконання завдань у реальному світі потрібні два ключові елементи: високорівневе розуміння світу та здатність міркувати», — зазначив старший інженер-дослідник підрозділу Фредерік Бесс.
Якщо людина попросить гуманоїдного робота перевірити, скільки банок квасолі залишилось у шафі, йому потрібно розуміти, що таке квасоля, шафа, і вміти дістатися до потрібного місця.
SIMA 2 якраз і стосується цього «високого рівня поведінки», зазначив Бесс.
Строки інтеграції нового рішення у фізичних роботів поки невідомі.
Шопінг
Ще одна сфера, що цікавить пошукового гіганта, — ШІ-покупки. Компанія випустила набір нових інструментів для онлайн-шопінгу. Серед них:
- голосові покупки в Google Search;
- покупки в застосунку Gemini;
- агентський чек-аут;
- ШІ-інструмент, здатний сам телефонувати до магазинів і уточнювати наявність потрібних товарів.
«Ми вважаємо, що процес покупок не має бути таким виснажливим. Ідея в тому, щоб зберегти всі приємні частини процесу — перегляд товарів, випадкові знахідки — і прибрати нудні та складні етапи», — зазначила віцепрезидентка і керівниця напряму реклами та комерції в Google Відх’я Шрінівасан.
Один з апдейтів — розмовні покупки в режимі AI Mode. Користувач може спілкуватися з пошуковиком як із чат-ботом, а той покаже зображення товарів, додасть деталі на кшталт ціни, відгуків і наявності.
Застосунок Gemini навчили формувати розгорнуті ідеї та добірки, а не обмежуватися короткими текстовими порадами за шопінг-запитами. Поки функція доступна тільки у США.
Агентський чек-аут — автоматична перевірка змін щодо цікавого товару. Сервіс здатен надсилати сповіщення про зниження ціни.
«Це корисно для покупців — їм не потрібно постійно перевіряти ціну на потрібний товар. І це корисно для продавців — покупці повернуться, хоча в іншому разі пішли б», — сказала віцепрезидентка з продуктів Google Shopping Ліліан Рінкон.
Ще одна нова функція дозволяє ШІ телефонувати до магазинів від імені користувача й питати про наявність товару, а також чинні акції. Вона базується на технології Google Duplex, представленій 2018 року, Shopping Graph і платіжній інфраструктурі Google.
Щоб скористатися інструментом, потрібно вказати бажаний товар. ШІ обдзвонить локальні магазини, уточнить деталі й надасть стислий звіт.
Нагадаємо, у листопаді Google додала зведення повідомлень, пріоритизацію сповіщень та інші функції на базі штучного інтелекту у смартфони Pixel.