Google представила ШІ-курсор, Googlebook і пакет Gemini Intelligence

Google DeepMind розробляє комп’ютерний курсор із ШІ на базі Gemini — компанія має намір переосмислити технологію, яка не змінювалася понад пів століття.

«Ми досліджуємо нові можливості на базі ШІ, які допоможуть курсору не лише розуміти, на що він вказує, а й чому це важливо для користувача», — йдеться в блозі компанії.

Проєкт вирішує поширену проблему: стандартний ШІ-інструмент працює в окремому вікні, і користувачу доводиться перетягувати туди свій контент.

«Ми прагнемо протилежного: інтуїтивного штучного інтелекту, який взаємодіє з користувачами в усіх їхніх інструментах, не перериваючи робочий процес», — заявили в компанії.

Чотири принципи ШІ-курсора

У Google DeepMind сформулювали чотири принципи, що перекладають передачу контексту й намірів із користувача на комп’ютер і замінюють текстові промпти інтуїтивнішими способами взаємодії.

Збереження робочого потоку

Функції ШІ мають працювати в усіх застосунках, тож прототип курсора від Google DeepMind доступний всюди, де працює користувач. Наприклад, можна навести мишу на PDF-файл і запросити стисле резюме у вигляді списку, щоб вставити його в лист.

Інший приклад — навести курсор на таблицю зі статистичними даними та попросити побудувати кругову діаграму.

Покажи й розкажи

Сучасні нейромережі потребують точних інструкцій, і для якісної відповіді користувачу доводиться складати детальний промпт. ШІ-курсор спрощує цей процес: він фіксує візуальний і семантичний контекст, дозволяючи моделі «побачити» та зрозуміти, що саме важливо.

В експериментальній системі Google DeepMind достатньо вказати на абзац, фрагмент зображення чи блок коду — і LLM зрозуміє, з чим потрібна допомога.

Сила слів «це» і «те»

У повсякденному спілкуванні люди рідко вдаються до довгих і детальних фраз. Вони кажуть: «полагодь це», «перенеси це сюди» або «що це означає», паралельно покладаючись на жести й спільний контекст.

«ШІ-система, здатна розуміти це поєднання контексту, жестів і мовлення, дозволить юзерам формулювати комплексні запити природним і лаконічним чином без застосування складних промптів», — йдеться в блозі Google DeepMind.

https://forklog.com/wp-content/uploads/img-b1bbcead5c2dd999-4264398902492416.mp4

Пікселі для взаємодії

Десятиліттями комп’ютери відстежували лише напрямок погляду. ШІ здатен зрозуміти, на що саме вказує користувач, і перетворити пікселі на структуровані об’єкти для миттєвої взаємодії.

«Фотографія з начерками перетворюється на інтерактивний список справ, стоп-кадр із відео про подорож — на посилання для бронювання столика в тому симпатичному ресторані», — зазначили в Google DeepMind.

Реалізація

Google DeepMind впроваджує ці принципи в Chrome і новому інтерфейсі для ноутбуків Googlebook.

«Від сьогодні замість введення складних запитів ви можете використати курсор, щоб спитати Gemini в Chrome про ту частину вебсторінки, яка вас цікавить», — йдеться в блозі.

Наприклад, можна вибрати кілька товарів на сторінці та попросити порівняти їх або вказати місце, де слід візуалізувати новий диван у вітальні.

Найближчим часом компанія запустить Magic Pointer у Googlebook. Функція дозволить застосовувати Gemini одним рухом пальця.

Googlebook

Google представила «нову категорію ноутбуків» на базі можливостей Gemini, що поєднує Android і ChromeOS.

«Понад 15 років тому ми представили Chromebook — ноутбук, створений для світу, де пріоритет мають хмарні технології. Сьогодні, під час переходу від ОС до інтелектуальної системи, ми бачимо можливість знову переосмислити концепцію ноутбуків», — йдеться в анонсі.

Googlebook розроблені для Gemini Intelligence і нового ШІ-курсора. Пристрої отримали функцію «Створити віджет» із підтримкою голосових команд.

Gemini може шукати інформацію в інтернеті або під’єднуватися до застосунків Google на кшталт Gmail і «Календар» для створення єдиної персоналізованої панелі керування.

Інструмент побудований на технологічному стеку Android, що забезпечує безшовну роботу з кількома пристроями: функція «Швидкий доступ» дозволяє переглядати, шукати та вставляти файли з телефона на ноутбук без ручного перенесення.

Перші Googlebook створюються спільно з Acer, ASUS, Dell, HP і Lenovo.

Gemini Intelligence

Gemini Intelligence — набір ШІ-функцій для Android-пристроїв. Влітку 2026 року вони з’являться спочатку на Samsung Galaxy та Google Pixel, а згодом — на інших гаджетах.

«Ця система поєднує першокласне апаратне забезпечення та інноваційне ПЗ, щоб допомагати вам завжди бути на крок попереду, проактивно розв’язуючи задачі впродовж дня. Паралельно забезпечуються конфіденційність даних і повний контроль над ними», — йдеться в анонсі.

Деякі агентні можливості Gemini вже показали на початку 2026 року на смартфонах Samsung — наприклад, замовлення їжі чи таксі. Незабаром помічник зможе виконувати складніші завдання: достатньо сфотографувати брошуру туру, і бот знайде схожі варіанти на Expedia.

У Chrome ШІ-асистент допоможе знаходити, узагальнювати та порівнювати контент на різних сторінках. Функція Rambler на клавіатурі Gboard дозволить надиктувати текст, потім виділить важливі фрагменти й збере їх у зв’язне повідомлення без слів-паразитів і повторів.

Нагадаємо, у березні Google розширила ШІ-можливості в Docs, Sheets, Slides і Drive.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK
Exit mobile version