Google представила «найкращу у світі» ШІ‑модель Gemini 3

Google представила Gemini 3 — свою найпотужнішу ШІ‑модель, яка поєднує всі можливості лінійки й «вважається найкращою у світі».

«Кожне покоління Gemini засноване на попередньому. Прориви Gemini 1 у сфері вбудованої мультимодальності та довгого контекстного вікна розширили діапазон оброблюваної інформації та її обсяг. Gemini 2 заклав основу для агентних можливостей і розсунув межі міркувань і мислення. […] Gemini 2.5 Pro очолював рейтинг LMArena понад шість місяців», — йдеться в анонсі.

Gemini 3 — «передове рішення» для логічного мислення, створене для глибокого розуміння і нюансів. Вона розуміє тонкі деталі у креативних ідеях і розбирає комплексні завдання.

«ШІ значно краще розуміє контекст і зміст промпта, тож ви отримуєте те, що вам потрібно, з меншою кількістю підказок», — написала команда в блозі.

Модель уже доступна в пошуку Google, застосунку Gemini, AI Studio, Vertex AI та безплатному середовищі для вайб‑кодингу Google Antigravity.

«Це найкраща у світі модель для мультимодального розуміння і наша найпотужніша нейромережа для агентного та вайб‑кодингу. Вона забезпечує багату візуалізацію та глибшу інтерактивність — усе на базі сучасних методів міркувань», — зазначили CEO Google DeepMind Деміс Хассабіс і технічний директор Корай Кавукчуоглу.

Додатково представлено вдосконалений режим міркувань Gemini 3 Deep Think. Спершу до нього отримають доступ тестувальники з безпеки, після чого інструмент стане доступним для підписників Google AI Ultra.

Цифри

Gemini 3 Pro здатна «втілити в життя будь‑яку ідею» завдяки «сучасному мисленню» та мультимодальним можливостям. Модель суттєво перевершила версію 2.5 Pro за всіма ключовими показниками.

У рейтингу LMArena вона посіла перше місце з результатом 1501 Elo, демонструючи міркування на рівні доктора наук. Високі показники також зафіксовано в тестах Humanity’s Last Exam (37,5%) і GPQA Diamond (91,9%).

image
Основні бенчмарки. Джерело: Google.

У тесті з математики MathArena Apex модель отримала 23,4%. В завданнях на мультимодальне мислення результати вищі: на MMMU‑Pro — 81%, а у Video‑MMMU — 87,6%. У SimpleQA Verified показник склав 72,1%.

«Це означає, що Gemini 3 Pro має високу здатність розв’язувати складні проблеми у широкому спектрі тем, таких як наука і математика, з високим рівнем надійності», — йдеться в блозі.

Команда проєкту підкреслила, що відповіді Gemini 3 Pro розумні, лаконічні й прямі. Вона «каже вам те, що потрібно почути, а не те, що ви хочете».

Gemini 3 Deep Think

Gemini 3 Deep Think — новий режим міркувань на базі Gemini 3, який під час тестів набрав 41% у Humanity’s Last Exam, 93,8% у GPQA Diamond і 45,1% в ARC‑AGI‑2.

image
Тести Deep Think Gemini 3. Джерело: Google.

Компанія позиціонує Gemini 3 як універсального помічника, здатного впоратися з будь‑якими завданнями завдяки мультимодальному мисленню та високій продуктивності. Модель підтримує контекстне вікно обсягом до 1 млн токенів.

Модель може розпізнати рукописний рецепт різними мовами з сімейної кулінарної книги, знайти наукові статті, відеолекції та навчальні посібники з потрібної теми або згенерувати код для інтерактивних карток, візуалізацій та інших форматів.

Вайб‑кодинг

Розробники відзначили поліпшені можливості Gemini 3 в галузі агентного та вайб‑кодингу — модель обробляє складні промпти й інструкції та робить продукти більш автономними. Вона набрала 1487 Elo у WebDev Aren, 54,2% у Terminal‑Bench 2.0 і 76,2% у SWE‑bench Verified.

Корпорація також представила платформу для створення ШІ‑агентів Google Antigravity. За словами розробників, вона перетворює цифрового асистента на активного партнера, здатного самостійно планувати й виконувати комплексні завдання, одночасно перевіряючи власний код.

Сервіс інтегрований із моделлю редагування зображень Nano Banana.

Gemini 3 очолила рейтинг Vending‑Bench 2. Бенчмарк тестує здатність планувати на тривалі періоди.

image
Gemini 3 Pro демонструє ефективне довгострокове планування. Джерело: Google.

Gemini 3 краще допомагає в повсякденних завданнях на кшталт бронювання місцевих послуг або організації поштової скриньки. Підписники Google AI Ultra можуть спробувати агентні можливості в застосунку Gemini.

Безпека

Google заявляє про високий рівень безпеки Gemini 3. За результатами комплексної перевірки модель показала зниження схильності до «улесливих» відповідей, підвищену стійкість до атаки типу ін’єкція промпта та поліпшений захист від зловживань через кібератаки.

Найближчим часом планується випуск додаткових моделей із серії Gemini 3.

Нагадаємо, у листопаді Google представила низку нових рішень у сфері агентного ШІ. Серед них: режим глибоких досліджень у NotebookLM, «мозок для роботів» SIMA 2 та інструменти для шопінгу.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK