В Mistral AI представили відкриту аудіомодель

Французький ШІ-проєкт Mistral AI презентував відкриту модель розпізнавання мовлення під назвою Voxtral.

Інструмент орієнтований на бізнес і призначений для інтеграції у виробничі процеси. Його позиціонують як рішення для створення прикладного мовного інтелекту.

У компанії стверджують, що Voxtral — це доступна альтернатива, яка коштує «менше половини» від вартості аналогів.

Модель здатна транскрибувати до 30 хвилин аудіо та «розуміти» до 40 хвилин, дозволяє ставити запитання до змісту, створювати резюме або перетворювати голосові команди на дії — зокрема виклик API чи запуск функцій у реальному часі.

Voxtral підтримує кілька мов і розпізнає англійську, іспанську, французьку, португальську, гінді, німецьку, нідерландську та італійську.

Компанія пропонує два варіанти моделі:

  • Voxtral Small — містить 24 млрд параметрів і орієнтована на промислове використання;
  • Voxtral Mini — 3 млрд параметрів, придатна для локального розгортання.

Окремо доступна спрощена версія Voxtral Mini Transcribe — наддешева й швидка модель, оптимізована виключно для транскрипції.

Voxtral можна протестувати безкоштовно на Hugging Face або в чат-боті Le Chat. Вартість API-інтеграції стартує з $0,001 за хвилину.

Mistral AI вважається провідним ШІ-стартапом Європи, здатним конкурувати з компаніями зі США та Китаю. У лютому проєкт випустив мобільний застосунок для iOS та Android.

Нагадаємо, у січні в Mistral AI оголосили плани провести IPO.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK