Масштабне оновлення Chrome: бокова панель Gemini, Nano Banana та «Персональний інтелект»

Google інтегрує в браузер Chrome нові інструменти ШІ на базі Gemini. Ключові новації — генератор зображень Nano Banana, «Персональний інтелект» і «Автоперегляд».

Інтеграція в інтерфейс

ШІ-асистент, доданий у вересні 2025 року у вигляді спливаючого вікна, тепер закріплений у боковій панелі. Користувач може ставити запитання про вебсайт, який переглядає, або інші відкриті вкладки.

Серед оновлень — аналіз кількох вкладок як єдиного цілого. Коли користувач відкриває різні сторінки одного сайту, цифровий помічник сприймає їх не окремо, а як єдину контекстну групу.

Раніше Gemini в Chrome був доступний лише користувачам Windows і macOS. Після оновлення він відкритий і для власників Chromebook Plus.

Personal Intelligence

Корпорація використовує нещодавно запущену функцію Personal Intelligence, яка під’єднується до облікових записів Gmail, Search, YouTube і Google Photos та дозволяє ставити запитання з урахуванням особистих даних. Функція з’явиться протягом найближчих місяців.

Nano Banana

Інструмент дає змогу редагувати та модифікувати зображення, використовуючи як референси інші картинки, знайдені в інтернеті.

«Автоперегляд»

ШІ-агент здатний автономно виконувати завдання: переходити за посиланнями, здійснювати покупки або шукати знижкові купони. Він попросить втрутитися у разі потреби працювати з конфіденційними даними.

Ризики безпеки

ШІ-браузери стають трендом у секторі штучного інтелекту, однак несуть суттєві ризики для користувачів. У грудні 2025 року OpenAI розповіла про наявні вразливості.

Компанія визнала, що атаки типу «ін’єкція промпта» є проблемою.

«Подібна вразливість, як і шахрайство та соціальна інженерія в інтернеті, навряд чи коли-небудь будуть повністю усунені», — написали представники OpenAI.

Anthropic і Google дотримуються схожої позиції зі ставкою на багаторівневий захист і регулярні стрес-тести.

Agentic Vision у Gemini

Паралельно Google представила Agentic Vision — функцію, що дає змогу детальніше досліджувати файли в режимі ШІ-агента.

У компанії пояснили, що LLM нового покоління на кшталт Gemini зазвичай обробляють інформацію про навколишній світ за один статичний погляд. Якщо вони пропускають дрібні деталі на кшталт серійного номера на мікрочипі або віддаленого дорожнього знака, то «роблять припущення».

Agentic Vision у Gemini 3 Flash перетворює розуміння зображень зі статичної дії на активний процес. Модель поводиться як аналітик-людина:

  • оцінює загальну картину;
  • виокремлює пріоритетні зони;
  • будує план перевірки гіпотез;
  • детально вивчає дрібні елементи.

У результаті точність розпізнавання зростає на 5–10%.

image
Джерело: Google.

Agentic Vision вводить цикл «думати, діяти, спостерігати» в задачі розуміння зображень:

  • думати — ШІ аналізує запит користувача та вихідну ілюстрацію, формуючи багатоетапний план;
  • діяти — модель генерує та виконує код Python для роботи зі зображенням (кадрування, поворот);
  • спостерігати — перетворене зображення додається в контекстне вікно моделі.
image
Джерело: Google.

Gemini 3 Flash навчена збільшувати зображення за виявлення дрібних деталей.

Бета-версія Agentic Vision доступна безкоштовно в Google AI Studio, Vertex AI, Gemini API для розробників та чат-боті Gemini в режимі Thinking.

Нагадаємо, у грудні 2025 року Google випустила мовну модель Gemini 3 Flash і зробила її стандартною в застосунку Gemini та режимі ШІ в пошуковику.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK