Zhipu AI випустила GLM-5.2 з контекстом у 1 млн токенів


Китайський стартап Zhipu AI випустив флагманську мовну модель GLM-5.2 для довгих агентних задач і програмування. Рішення з відкритим кодом має контекстне вікно у 1 млн токенів, ліцензію MIT і підтримку локального розгортання.
У картці на Hugging Face розробка вказана як модель для генерації тексту англійською та китайською мовами. Розмір — 753 млрд параметрів.
GLM-5.2 підтримує кілька рівнів «інтенсивності міркувань», щоб обирати між якістю та затримкою. В архітектуру також інтегровані IndexShare та оновлений шар MTP для спекулятивного декодування.
За заявою розробників, IndexShare повторно використовує один індексатор на кожні чотири шари розрідженої уваги і зменшує кількість операцій на токен у 2,9 раза. Оновлення MTP збільшує довжину підтвердження до 20%.
У трьох ключових бенчмарках — FrontierSWE, PostTrainBench і SWE-Marathon — GLM-5.2 обійшла інші моделі з відкритим кодом.

У стандартних тестах продуктивності програмування GLM-5.2 теж стала найпотужнішою моделлю з відкритим кодом.

GLM-5.2 поширюється за відкритою ліцензією MIT. Для локального розгортання заявлено підтримку SGLang, vLLM, Transformers, KTransformers і Docker Model Runner. Доступні квантизації для llama.cpp, Ollama та LM Studio.
Нагадаємо, у червні IT-компанія Ріо-де-Жанейро IplanRIO представила Rio 3.5 Open 397B як відкриту ШІ-модель, навчену на державні кошти. Втім за день команда Nex заявила, що інструмент виглядає як пряме злиття Nex-N2-Pro і Qwen3.5-397B-A17B.