Nvidia анонсувала нові технології на GTC 2024
Компанія Nvidia анонсувала нове покоління ШІ-чіпів і програмне забезпечення для роботи з великими мовними моделями. Презентація відбулася на конференції GTC 2024.
За словами CEO компанії Дженсена Хуанга, кожні два роки Nvidia оновлює архітектуру GPU з метою підвищення продуктивності. Багато з раніше випущених ШІ-моделей навчені на архітектурі Hopper. Вона використовується в чипах на кшталт H100, анонсованих у 2022 році.
«Hopper — це фантастика, але нам потрібні більш потужні GPU», — заявив генеральний директор компанії.
Нове покоління графічних ШІ-процесорів отримало назву Blackwell. Перша модель GB200 буде випущена наприкінці цього року.
Nvidia стверджує, що нові процесори забезпечують істотний приріст продуктивності для компаній, що працюють з нейромережами — 20 петафлопс у нових чіпів замість 4 петафлопс у H100. За словами Хуанга, додаткова обчислювальна потужність дасть їм змогу навчати більші і складніші моделі.
Наприклад, для тренування GPT-4 за 90 днів знадобилося 8000 старих чипів і 15 МВт потужності. Для навчання на новій відеокарті знадобиться всього 2000 процесорів і 4 МВт.
Також стало відомо, що GB200 матиме 192GB пам’яті з пропускною спроможністю 8 ТБ/с.
«Blackwell — не просто чіп, це ціла платформа», — зазначив Хуанг.
Графічний процесор об’єднує дві окремо виготовлені матриці в один чіп, вироблений компанією TSMC. Сукупно в них міститься 208 млрд транзисторів.
Модель стане доступна у вигляді сервера під назвою GB200 NVLink 2, що складається з 72 графічних процесорів Blackwell. Його загальний обсяг оперативної пам’яті складе 30 ТБ.
Компанія продаватиме доступ до GB200 через хмарні сервіси. Nvidia повідомила, що Amazon Web Services побудує серверний кластер, що складається з 20 000 цих моделей.
Хуанг також оголосив про додавання нового продукту під назвою Nvidia Inference Microservice (NIM) до підписки на корпоративне ПЗ. Він спрощує використання старих графічних процесорів для обчислень.
Нагадаємо, у січні 2024 року Марк Цукерберг пообіцяв закупити чипи Nvidia для Meta, оскільки «майбутня дорожня карта» в галузі штучного інтелекту вимагає «величезної обчислювальної інфраструктури».