IBM прискорила ШІ‑модель за допомогою квантового процесора

Дослідники Multiverse Computing заявили про квантове покращення великої мовної моделі на обладнанні IBM. Йдеться про гібридну схему з використанням 156-кубітного процесора Heron.

Автори назвали експеримент першим «наскрізним квантовим покращенням» LLM на надпровідниковому процесорі для авторегресійної генерації тексту.

У тестах використовували Llama 3.1 8B від Meta. Базову модель не донавчали: параметри «заморозили» і додали квантові адаптери — Cayley-parameterized unitary adapters (CUA). Спочатку їх навчали класичним методом, далі під’єднали до гібридної квантово-класичної схеми.

Експеримент провели на IBM Quantum System Two — архітектурі для гібридних квантових систем. В установці задіяли 156-кубітний чип Heron.

Гібридна версія знизила перплексію Llama 3.1 8B на 1,4%. Для цього додали близько 6000 параметрів — приблизно 0,000075% від розміру моделі.

Під час демонстрації квантово-покращена Llama правильно відповіла на запитання з астрономії та біології, з якими не впоралася базова версія (наприклад, про наявність кілець у всіх планет-гігантів).

За словами провідного автора дослідження Борхи Айспуруа, робота є доказом концепції. Квантові блоки дозволили точніше передбачати наступний токен у тексті за мінімальних витрат обчислювальних потужностей.

Команда розраховує домогтися подальшого зниження перплексії та зростання точності за меншої кількості параметрів порівняно з повністю класичними підходами.

Нагадаємо, у травні котирування квантових компаній зросли після оголошення Мінторгу США про виділення $2 млрд американським фірмам у межах програми CHIPS R&D.

Читайте ForkLog UA в соціальних мережах

Знайшли помилку в тексті? Виділіть її та натисніть CTRL+ENTER

Матеріали за темою

Ми використовуємо файли cookie для покращення якості роботи.

Користуючись сайтом, ви погоджуєтесь з Політикою приватності.

OK
Exit mobile version