OpenAI представила розробникам налаштування голосового режиму

OpenAI анонсувала кілька нових інструментів, включно з публічною бета-версією Realtime API для створення додатків із можливістю голосових відповідей із низькою затримкою. Про це пише TechCrunch.

Завдяки новій функції розробники можуть створювати у своїх додатках голосове спілкування в реальному часі з підтримкою шести голосів.

Керівник відділу розробки Ромен Юет як приклад показав застосунок для планування поїздок, який дає змогу усно спілкуватися з ШІ-помічником.

Серед інших анонсів OpenAI — налаштування «зору» штучного інтелекту, яке допоможе розробникам поліпшити візуальне розуміння нейромережі.

Також представлено функцію використання більших моделей на кшталт o1-preview і GPT-4o для навчання менших.

Директор із продуктів OpenAI Кевін Вайль зазначив, що нещодавні відходи технічного директора Міри Мураті та головного наукового директора Боба МакГрю не вплинуть на роботу компанії.

Тим часом один зі співзасновників OpenAI Дюрк Кінгма приєднався до конкуруючого ШІ-стартапу Anthropic.

Він пішов із компанії Сема Альтмана 2018 року, вирішивши стати бізнес-ангелом і консультантом для ШІ-стартапів.

Anthropic заснований 2021 року колишнім віцепрезидентом OpenAI Даріо Амодеєм і його сестрою Даніелою Амодей.

У серпні фірма переманила співзасновника компанії-розробника ChatGPT Джона Шульмана. У травні вона найняла колишнього керівника з безпеки OpenAI Яна Лейке.

Нагадаємо, стартап Альтмана веде переговори про залучення $6,5 млрд при оцінці в $150 млрд.

У вересні він анонсував запуск розширеного голосового режиму ChatGPT.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK