Google представила ШІ-курсор, Googlebook і пакет Gemini Intelligence


Google DeepMind розробляє комп’ютерний курсор із ШІ на базі Gemini — компанія має намір переосмислити технологію, яка не змінювалася понад пів століття.
«Ми досліджуємо нові можливості на базі ШІ, які допоможуть курсору не лише розуміти, на що він вказує, а й чому це важливо для користувача», — йдеться в блозі компанії.
Проєкт вирішує поширену проблему: стандартний ШІ-інструмент працює в окремому вікні, і користувачу доводиться перетягувати туди свій контент.
«Ми прагнемо протилежного: інтуїтивного штучного інтелекту, який взаємодіє з користувачами в усіх їхніх інструментах, не перериваючи робочий процес», — заявили в компанії.
Чотири принципи ШІ-курсора
У Google DeepMind сформулювали чотири принципи, що перекладають передачу контексту й намірів із користувача на комп’ютер і замінюють текстові промпти інтуїтивнішими способами взаємодії.
Збереження робочого потоку
Функції ШІ мають працювати в усіх застосунках, тож прототип курсора від Google DeepMind доступний всюди, де працює користувач. Наприклад, можна навести мишу на PDF-файл і запросити стисле резюме у вигляді списку, щоб вставити його в лист.
Інший приклад — навести курсор на таблицю зі статистичними даними та попросити побудувати кругову діаграму.
Покажи й розкажи
Сучасні нейромережі потребують точних інструкцій, і для якісної відповіді користувачу доводиться складати детальний промпт. ШІ-курсор спрощує цей процес: він фіксує візуальний і семантичний контекст, дозволяючи моделі «побачити» та зрозуміти, що саме важливо.
В експериментальній системі Google DeepMind достатньо вказати на абзац, фрагмент зображення чи блок коду — і LLM зрозуміє, з чим потрібна допомога.
Сила слів «це» і «те»
У повсякденному спілкуванні люди рідко вдаються до довгих і детальних фраз. Вони кажуть: «полагодь це», «перенеси це сюди» або «що це означає», паралельно покладаючись на жести й спільний контекст.
«ШІ-система, здатна розуміти це поєднання контексту, жестів і мовлення, дозволить юзерам формулювати комплексні запити природним і лаконічним чином без застосування складних промптів», — йдеться в блозі Google DeepMind.
Пікселі для взаємодії
Десятиліттями комп’ютери відстежували лише напрямок погляду. ШІ здатен зрозуміти, на що саме вказує користувач, і перетворити пікселі на структуровані об’єкти для миттєвої взаємодії.
«Фотографія з начерками перетворюється на інтерактивний список справ, стоп-кадр із відео про подорож — на посилання для бронювання столика в тому симпатичному ресторані», — зазначили в Google DeepMind.
Реалізація
Google DeepMind впроваджує ці принципи в Chrome і новому інтерфейсі для ноутбуків Googlebook.
«Від сьогодні замість введення складних запитів ви можете використати курсор, щоб спитати Gemini в Chrome про ту частину вебсторінки, яка вас цікавить», — йдеться в блозі.
Наприклад, можна вибрати кілька товарів на сторінці та попросити порівняти їх або вказати місце, де слід візуалізувати новий диван у вітальні.
Найближчим часом компанія запустить Magic Pointer у Googlebook. Функція дозволить застосовувати Gemini одним рухом пальця.
Googlebook
Google представила «нову категорію ноутбуків» на базі можливостей Gemini, що поєднує Android і ChromeOS.
«Понад 15 років тому ми представили Chromebook — ноутбук, створений для світу, де пріоритет мають хмарні технології. Сьогодні, під час переходу від ОС до інтелектуальної системи, ми бачимо можливість знову переосмислити концепцію ноутбуків», — йдеться в анонсі.
Googlebook розроблені для Gemini Intelligence і нового ШІ-курсора. Пристрої отримали функцію «Створити віджет» із підтримкою голосових команд.
Gemini може шукати інформацію в інтернеті або під’єднуватися до застосунків Google на кшталт Gmail і «Календар» для створення єдиної персоналізованої панелі керування.
Інструмент побудований на технологічному стеку Android, що забезпечує безшовну роботу з кількома пристроями: функція «Швидкий доступ» дозволяє переглядати, шукати та вставляти файли з телефона на ноутбук без ручного перенесення.
Перші Googlebook створюються спільно з Acer, ASUS, Dell, HP і Lenovo.
Gemini Intelligence
Gemini Intelligence — набір ШІ-функцій для Android-пристроїв. Влітку 2026 року вони з’являться спочатку на Samsung Galaxy та Google Pixel, а згодом — на інших гаджетах.
«Ця система поєднує першокласне апаратне забезпечення та інноваційне ПЗ, щоб допомагати вам завжди бути на крок попереду, проактивно розв’язуючи задачі впродовж дня. Паралельно забезпечуються конфіденційність даних і повний контроль над ними», — йдеться в анонсі.
Деякі агентні можливості Gemini вже показали на початку 2026 року на смартфонах Samsung — наприклад, замовлення їжі чи таксі. Незабаром помічник зможе виконувати складніші завдання: достатньо сфотографувати брошуру туру, і бот знайде схожі варіанти на Expedia.
У Chrome ШІ-асистент допоможе знаходити, узагальнювати та порівнювати контент на різних сторінках. Функція Rambler на клавіатурі Gboard дозволить надиктувати текст, потім виділить важливі фрагменти й збере їх у зв’язне повідомлення без слів-паразитів і повторів.
Нагадаємо, у березні Google розширила ШІ-можливості в Docs, Sheets, Slides і Drive.