В Mistral AI представили відкриту аудіомодель
Французький ШІ-проєкт Mistral AI презентував відкриту модель розпізнавання мовлення під назвою Voxtral.
Introducing the world’s best (and open) speech recognition models! pic.twitter.com/tUnPcdCrbZ
— Mistral AI (@MistralAI) July 15, 2025
Інструмент орієнтований на бізнес і призначений для інтеграції у виробничі процеси. Його позиціонують як рішення для створення прикладного мовного інтелекту.
У компанії стверджують, що Voxtral — це доступна альтернатива, яка коштує «менше половини» від вартості аналогів.
Модель здатна транскрибувати до 30 хвилин аудіо та «розуміти» до 40 хвилин, дозволяє ставити запитання до змісту, створювати резюме або перетворювати голосові команди на дії — зокрема виклик API чи запуск функцій у реальному часі.
Voxtral підтримує кілька мов і розпізнає англійську, іспанську, французьку, португальську, гінді, німецьку, нідерландську та італійську.
Компанія пропонує два варіанти моделі:
- Voxtral Small — містить 24 млрд параметрів і орієнтована на промислове використання;
- Voxtral Mini — 3 млрд параметрів, придатна для локального розгортання.
Окремо доступна спрощена версія Voxtral Mini Transcribe — наддешева й швидка модель, оптимізована виключно для транскрипції.
Voxtral можна протестувати безкоштовно на Hugging Face або в чат-боті Le Chat. Вартість API-інтеграції стартує з $0,001 за хвилину.
Mistral AI вважається провідним ШІ-стартапом Європи, здатним конкурувати з компаніями зі США та Китаю. У лютому проєкт випустив мобільний застосунок для iOS та Android.
Нагадаємо, у січні в Mistral AI оголосили плани провести IPO.