DeepSeek представив оновлену ШІ-модель V3.1

20.08.2025 ForkLog UA

Китайський стартап DeepSeek оновив свою флагманську мовну модель V3 та прибрав згадку про reasoning-мережу R1 у чат-боті. Про це повідомляє SCMP.

Реліз DeepSeek V3.1 відбувся у WeChat. Оновлення розширює контекстне вікно до 128 000 токенів, що дозволяє моделі обробляти більші обсяги даних під час взаємодії з користувачем. Для порівняння, це приблизно відповідає книзі на 300 сторінок.

Також відзначається підвищена ефективність використання токенів.

У бенчмарку Aider Polyglot, що оцінює можливості LLM у розв’язанні складних завдань програмування різними мовами, DeepSeek V3.1 перевершує Claude 4 Opus.

DeepSeek V3.1 beats Claude 4 Opus on Aider Polyglot

This makes it the best non-TTC coding model and all of that for ~$1 pic.twitter.com/QyJZnVRdVK

— Lisan al Gaib (@scaling01) 19 серпня 2025

V3.1 має 685 млрд параметрів і побудована на гібридній архітектурі, що забезпечує продуктивність у завданнях діалогу, логічних міркувань та програмування.

Компанія також прибрала згадку R1 з функції «глибокого мислення». У SCMP припускають, що це може свідчити про складнощі у розробці очікуваної версії R2.

Нагадаємо, OpenAI переглянула внутрішню політику захисту інтелектуальної власності на тлі побоювань щодо корпоративного шпигунства з боку китайських конкурентів.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Біткоїн і Ethereum втрималися на тлі падіння акцій виробників ШІ-чипів

Alibaba заборонить продукти Anthropic через ризики безпеки

У Шанхаї запустили інкубаційну зону квантових обчислень

Дослідники залучили ШІ до аналізу квантових схем

Cloudflare блокуватиме «змішані» ШІ-краулери

В ООН попередили: ШІ може посилити глобальну нерівність

Anthropic повертає доступ до Fable 5 після скасування експортних обмежень США

Сенатори США запропонували блокувати технологічні угоди з країнами ризику

SpinQ залучила 1 млрд юанів для відмовостійких квантових комп’ютерів