Tether розширила відкритий синтетичний набір даних для навчання ШІ


ШІ-відділ Tether Data — QVAC — значно розширив «найбільший у світі загальнодоступний синтетичний набір даних» для навчання штучного інтелекту.
У QVAC Genesis II додано 107 млрд нових токенів; показник досяг 148 млрд у 19 освітніх галузях. Це «суттєво збільшує» масштаб, глибину та якість міркувань.
Друга версія охоплює 10 нових напрямів, зокрема хімію, інформатику, статистику, машинне навчання, астрономію, географію, економетрику та електротехніку.
QVAC Genesis II відтворює фізику «університетського рівня» і разом із Genesis I становить «найповніший синтетичний освітній набір даних, коли-небудь представлений публіці».
В основі релізу лежить новий підхід до генерації інформації — Option-Level Reasoning. Його розроблено для вилучення структурованих міркувань із помилок моделі та правильних відповідей.
«Результатом є навчальні дані, які підкреслюють ясність, причинно-наслідковий зв’язок і прийняття рішень, а не лише поверхневу правильність», — йдеться в блозі компанії.
У Tether наголосили, що QVAC зосереджений на навчанні моделі думати, міркувати та пояснювати, а не імітувати.
«Сьогодні більшість програм оптимізуються під мовну плинність, а не розуміння. З цим релізом ми виходимо за межі обсягу й переходимо до структури, міркувань і ясності», — заявив CEO компанії Паоло Ардоіно.
Нагадаємо, у травні Tether анонсувала нову платформу QVAC для розробки «нескінченного і всюдисущого інтелекту», яка передбачає «запуск і еволюцію» ШІ-агентів на пристроях користувачів замість дата-центрів великих компаній.
У червні Ардоіно заявив, що протягом 15 років з’явиться трильйон ШІ-агентів, які використовуватимуть біткоїн і USDT для розрахунків і проведення транзакцій.