ШІ-оновлення Google: Gemini Deep Think, ШІ-математик і рушій розробки ліків

Google оновила режим міркувань Gemini 3 Deep Think. Інструмент позиціонується як рішення для складних завдань у науці та інженерії.

У тестах модель випередила GPT-5.2 від OpenAI і Claude Opus 4.6 від Anthropic, зокрема в ARC-AGI-2 з візуальними головоломками, MMMU-Pro для оцінки мультимодальних можливостей, Elo 3455 та «Останньому іспиті людства».

image
Джерело: Google.

«Ми оновили Gemini 3 Deep Think у тісній співпраці з ученими та дослідниками, щоб справлятися зі складними науковими викликами — там, де завдання часто не мають чітких рамок або єдиного правильного рішення, а дані надані неповні», — йдеться в блозі компанії.

Gemini 3 Deep Think демонструє передові результати в математиці та програмуванні, а також «відмінно» проявляє себе в природничих науках, включно з хімією і фізикою. Оновлений режим розв’язує задачі на рівні золотих медалістів міжнародних олімпіад.

У CMT-Benchmark модель набрала 50,5%, підтвердивши глибокі знання в галузі теоретичної фізики.

image
Джерело: Google.

«Окрім передових показників, Deep Think орієнтований на практичне застосування: він допомагає дослідникам інтерпретувати складні дані, а інженерам — моделювати фізичні системи за допомогою коду», — зазначили в Google.

Новий Deep Think доступний у застосунку Gemini для передплатників Google AI Ultra та в Gemini API для окремих розробників.

ШІ-математик від DeepMind

Підрозділ Google DeepMind представив ШІ-агента Aletheia. Модель встановила новий рекорд у бенчмарку IMO-ProofBench Advanced, розв’язавши 91,9% задач. Тест вважається одним із найскладніших у математиці.

Нейромережу побудовано на базі Gemini Deep Think. Система оснащена модулем верифікації: він виявляє помилки в чорновиках рішень і запускає ітеративний процес їх доопрацювання.

Ключова особливість агента — здатність визнати неможливість розв’язання задачі, що суттєво економить час дослідників.

Aletheia використовує Google Search для навігації складними науковими матеріалами, запобігаючи ймовірності використання хибних посилань і обчислювальних помилок під час роботи з науковими матеріалами.

Серед досягнень моделі:

У DeepMind підкреслили, що успіх Aletheia підтверджує актуальність законів масштабування: у доказовій математиці якість і надалі зростає завдяки ефективному застосуванню агентів.

Прорив у медицині

Дочірня компанія DeepMind — Isomorphic Labs — представила рушій IsoDDE для розробки лікарських препаратів. У складних тестах новинка вдвічі перевершила AlphaFold 3 за точністю прогнозів.

Остання стала великим проривом, адже змогла передбачати тривимірні структури білків і їхню взаємодію з молекулами. IsoDDE натомість демонструє цілком новий рівень:

  • модель прогнозує силу зв’язування (афінність) точніше за традиційні методи;
  • рушій може виявляти приховані структури («кишені») білків, у яких може зв’язуватися препарат;
  • підтримується широкий спектр складних молекул, включно з антитілами та великими біологічними структурами.

«IsoDDE пропонує масштабовану основу для ШІ-дизайну ліків, забезпечуючи точність прогнозів, необхідну для роботи з новими біологічними системами з безпрецедентною достовірністю», — йдеться в блозі компанії.

Нагадаємо, у січні медики позитивно відреагували на запуск ChatGPT Health для консультацій з питань здоров’я.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK