Чипи, генератори, робомобілі: чим запам’ятається 2022 рік для штучного інтелекту
2022 рік дійсно виявився складним для ШІ-індустрії. Війна в Україні, енергетична криза, інфляція, напруженість між США та Китаєм — кожна з цих подій прямо чи опосередковано вплинула на галузь.
Але, незважаючи на безпрецедентні виклики, 2022 рік подарував нам багато проривних розробок, які визначили вектор розвитку технологій. Нейромережі навчилися малювати фотореалістичні картинки та писати переконливі тексти, а роботаксі стали звичайним явищем для таких міст як Сан-Франциско чи Пекін.
Пропонуємо згадати, чим запам’ятався минулий рік у сфері штучного інтелекту й чого очікувати від наступних 12 місяців.
- США запровадили безпрецедентні обмеження на експорт передових чипів до Китаю.
- Генератори зображень та тексту стали одним із головних трендів соцмереж.
- ШІ-агенти освоїли низку ігор-пісочниць, «збагативши» дослідження в галузі навчання з підкріпленням.
- Розробники автономних транспортних засобів запустили комерційні служби роботаксі в найбільших містах Китаю та США.
Боротьба за ШІ-чипи
За останній рік протистояння між США та Китаєм посилилося. У вересні Білий дім обмежив експорт чипів, що використовуються для суперкомп’ютерів і штучного інтелекту в КНР. Під обмеження потрапила продукція Nvidia та AMD.
Через місяць американський уряд опублікував нові правила, які торкнулися вже 28 китайських компаній. Тепер виробники мікросхем мають отримувати експортну ліцензію. В уряді США зазначили, що більшість заявок буде відхилено.
У Сполучених Штатах такі заходи назвали забезпеченням національної безпеки. Влада країни побоюється, що американські технології можуть бути використані КНР у військових цілях.
За словами експертів, подібні обмеження США не запроваджували проти Китаю з 1990-х років. Вони ґрунтуються на законі про пряме іноземне виробництво, згідно з яким влада в будь-який момент може зупинити продаж продукції, створеної за допомогою американських технологій.
У разі успіху вжиті заходи можуть заморозити промисловість КНР із розробки мікросхем, вважають фахівці.
Того ж місяця експерти заявили, що виробники КНР швидко створять альтернативу американським ШІ-прискорювачам.
Як приклад вони вказали чип BR100 стартапу Biren Technologies, який не поступається своєму конкурентові — Nvidia A100. Однак, побоюючись вторинних санкцій, компанія TSMC призупинила їхнє відвантаження.
У грудні в ЗМІ з’явилася інформація про намір китайського уряду інвестувати 1 трлн юанів ($143 млрд) у напівпровідникову індустрію. Крім цього, КНР поскаржилася до Світової організації торгівлі з приводу експортного контролю.
Водночас Конгрес США ухвалив закон про стимулювання виробництва чипів у країні. Згідно з документом, місцеві виробники можуть отримати пільги та фінансування на будівництво нових заводів. На це виділили понад $50 млрд.
Криза техгігантів
У 2020 році, у розпал пандемії, споживання онлайн-контенту значно збільшилося і прибутки техгігантів почали зростати швидше, ніж очікувалось. На тлі цього компанії стали наймати більшу кількість співробітників, щоб відповідати великому попиту.
Проте антиковидні обмеження поступово пом’якшувалися, кордони відкривалися, а працівники поверталися до офісів. Через велику кількість макроекономічних викликів у III кварталі 2022 року техгіганти опинилися в складному фінансовому становищі.
Наслідком стали масові скорочення, які проводили майже всі компанії.
Першою про уповільнення найму нових фахівців повідомила Google. Також у корпорації провели низку оптимізаційних заходів, на кшталт скорочення відділу Area 120 та об’єднання картографічного підрозділу та сервісу Waze.
Microsoft, мабуть, однією з перших вдалася до непопулярних заходів. У жовтні техгігант «непомітно» для громадськості звільнив 1000 працівників. У компанії повідомили, що це звичайний процес, проте їм усе ж таки довелося призупинити набір нових співробітників.
Найбільш скандальної форми масові звільнення набули у Twitter. Після зміни власника компанія скоротила половину штату, включно із командою з етичного ШІ.
Через два тижні Ілон Маск звільнив 80% підрядників у всьому світі. Це близько 4400–5500 працівників відділів модерації, маркетингу, інженерів та інших.
Незабаром у ЗМІ з’явилися чутки про можливі скорочення в Meta. Через кілька днів компанія підтвердила плани щодо оптимізації штату та оголосила про звільнення 11 000 співробітників. Зміни торкнулися й команди дослідників машинного навчання.
Через декілька днів після Meta про звільнення 10 000 співробітників оголосили в Amazon. Скорочення торкнулися департаменту з розроблення голосового помічника Alexa та пов’язаних із ним пристроїв.
В очікуванні подальшого економічного спаду звільнення можуть продовжитися у 2023 році, зокрема в Google та Apple.
Вірусні генератори
У 2022 році особливо набули популярності алгоритми штучного інтелекту, що генерують різний контент, насамперед зображення. Мова йде про моделі на кшталт DALL-E 2, Stable Diffusion та Midjourney. Усі вони працюють за схожим принципом: користувач надсилає текстовий запит з описом, а алгоритм робить картинку з релевантним змістом.
Особливістю цих генераторів є їхній реалізм. Не завжди можна відрізнити, що створила людина, а що — машина. Більш того, DALL-E 2 може генерувати фотореалістичні зображення. Це стало приводом для побоювань за роботу фотографів та художників.
Сховища зображень, навпаки, тепло прийняли технологію та дозволили продавати картинки, створені ШІ. Серед них Getty Images, Adobe Stock та Shutterstock.
Однак подібні послуги зіткнулися з критикою через можливе порушення авторських прав. Розробники алгоритмів генерування зображень використовують реальні картинки, зокрема ліцензійні. Досі не вирішено питання, кому належать права на контент, створений ШІ, та наскільки законно використовувати авторські роботи в навчальних датасетах.
У кінці 2022 OpenAI також представила текстовий генератор ChatGPT, заснований на великій мовній моделі. За словами розробників, він уміє відповідати на запитання, визнавати помилки, сперечатися та відхиляти недоречні запити.
Але людська фантазія не обмежилася запропонованими можливостями, і користувачі почали експериментувати з алгоритмом. Як виявилося, він може створювати пісні, малювати прості зображення та навіть писати код.
Перевірити можливості програмування ChatGPT зголосився співзасновник Ethereum Віталік Бутерін. За його словами, чат-бот може відтворювати простий код, проте, незважаючи на непогані результати, вони часто містять помилки та не працюють.
Він підсумував, що алгоритм не замінить людей-програмістів у найближчому майбутньому.
Аналогічно генераторам зображень текстові моделі розкритикували через використання ліцензійного контенту для навчання. Зокрема, до них належить інструмент Copilot від GitHub, який натренували писати код на мільйонах рядків, які були взяті з відкритих репозиторіїв.
Користувачі платформи стверджують, що компанія незаконно використала їхні роботи. До того ж, інструмент в окремих випадках може відтворювати фрагменти коду, які захищені авторським правом.
У компанії визнали, що таке можливо. Однак розробники не вбачають у цьому нічого протизаконного. За їхніми словами, вони застосували принцип «сумлінного використання».
Водночас різного роду генератори далекі від рівня загального ШІ. Це алгоритми, які вміють «склеювати» фрагменти тексту з навчальних наборів. Текстові моделі не осмислюють контекст, що відтворюється, про що свідчить непрацюючий код і плагіат, згенерований ChatGPT або Copilot.
Не тільки шахи та ґо
У 2021 році DeepMind сказала, що «навчання з підкріпленням достатньо для досягнення загального штучного інтелекту». З того часу фірма, що належить холдингу Alphabet, наполегливо працює над створенням універсальних ШІ-агентів, які застосовуються в реальному світі.
На алгоритмах, призначених для гри в шахи і ґо компанія не зупинилася. У липні дослідники лабораторії заявили, що навчили ШІ «справедливо» розподіляти багатство в економічній онлайн-грі. Вони вважають, що подібна модель допоможе людям ефективніше керувати своїми ресурсами та отримувати максимальний прибуток, вирівнюючи при цьому дисбаланс між заможними та бідними.
Дослідники DeepMind окремо зазначили, що їхня робота не є «інструкцією до створення ШІ-уряду». Вони також не планують розробляти інструменти на базі штучного інтелекту для політики.
У вересні компанія показала ШІ-агентів, які вміють грати у футбол. Віртуальні спортсмени навчилися з нуля, починаючи з ходьби, закінчуючи маніпуляціями з м’ячем. Переглядаючи відео матчів, система вивчила правила гри, після чого дослідники провели декілька мінітурнірів.
До кінця року фахівці лабораторії показали одразу два алгоритми, які грають у «Стратего» та «Дипломатію» нарівні з людьми. Обидва розроблені з урахуванням навчання з підкріпленням.
Але не тільки DeepMind створювала та розвивала ШІ-агентів. У листопаді дослідники Meta представили алгоритм Cicero, який також грає в «Дипломатію».
Модель передбачає політику інших учасників для поточного ходу на основі стану дошки та загального діалогу, а потім формує власну стратегію на найближчий етап.
Інженери з OpenAI навчили ШІ грати у Minecraft. Нейромережа може бігати, плавати, обходити перешкоди, добувати ресурси, робити алмазні інструменти, полювати на тварин і готувати їжу.
Дослідники розробили метод попереднього відеонавчання, що дозволяє використовувати великий масив даних. Також вони натренували ШІ грати за допомогою емуляторів миші та клавіатури.
Компанія Sony представила штучний інтелект GT Sophy, який перемагає найкращих геймерів у гоночному симуляторі Gran Turismo. ШІ перевершує розроблені для ігор у шахи та ґо алгоритми, а також програми AlphaStar і OpenAI Five, заявили творці.
За словами дослідників, ігрові світи є ідеальними майданчиками для навчання штучного інтелекту. Вони складні та сповнені несподіванок, тому віртуальні агенти можуть приймати незвичайні рішення.
Підйом роботаксі
Останній рік безпілотні транспортні засоби переживають небувалий підйом. Крім продовження активної розробки провідними автовиробниками та незалежними стартапами, багато компаній уже розпочали монетизацію.
Лідери галузі запустили комерційні служби безпілотних таксі в деяких американських містах. Поїздки на робомобілях доступні мешканцям Сан-Франциско, Фінікса, Лас-Вегаса та Остіна. У Китаї безпілотне таксі представлено в Пекіні, Ухані, Шанхаї та інших локаціях.
У лютому Waymo отримала дозвіл від каліфорнійських регуляторів на тестування комерційних безпілотних поїздок. Спочатку автомобілі компанії могли перевозити лише співробітників. Також влада встановила обмеження щодо швидкості пересування, часу доби та погодних умов.
У листопаді керівництво штату дозволила Waymo перевозити приватних клієнтів і стягувати плату за послуги по всьому Сан-Франциско та округу Санта-Клара.
У сусідній Аризоні «дочка» Alphabet також збільшила присутність. Компанії дозволили комерційну експлуатацію в центрі Фінікса, а також трансфери пасажирів із місцевого аеропорту.
Творіння General Motors — Cruise — також склало конкуренцію Waymo в обох містах. У лютому компанія отримала дозвіл на тестування безпілотників у Сан-Франциско, а вже в червні регулятори дозволили комерційний запуск.
Восени в Cruise заявили про плани запустити роботаксі у Фініксі та Остіні до кінця року.
Стартап Motional, що є спільним підприємством Hyundai та Aptiv, не став конкурувати у вищезгаданих містах. Натомість компанія разом із Uber та Lyft запустила безпілотні поїздки в Лас-Вегасі.
На 2023 рік компанії поставили амбітну мету розгорнути роботаксі в Лос-Анджелесі.
Китайські виробники намагаються не відставати від американських конкурентів. У лютому розробник технологій автономного водіння AutoX оголосив про своє лідерство за кількістю роботаксі в країні. Автопарк компанії перевищив 1000 безпілотників.
У серпні техгігант Baidu розширив географію надання послуг роботаксі Apollo Go на Ухань та Чунцін. Безпілотники отримали можливість розвозити пасажирів за оплату в певних районах мегаполісів.
Уже в листопаді Baidu відзвітувала про популярність сервісу. За даними гендиректора компанії Робіна Лі, у третьому кварталі 2022 року безпілотники Apollo Go здійснили в середньому понад 15 поїздок на день у Пекіні, Шанхаї та Гуанчжоу.
У квітні стартап Pony.ai отримав ліцензію на комерційну експлуатацію роботаксі в Гуанчжоу. Компанія може розгорнути до ста безпілотників в одному з районів міста.
Однак 2022 рік пережили не всі стартапи з напрямку безпілотного водіння. У жовтні компанія Argo AI раптово припинила своє існування. Найбільші інвестори Volkswagen та Ford поділили між собою активи ліквідованої фірми, а також працевлаштували частину штату.
Через закриття стартапу постраждала і Lyft, втративши $135,7 млн. Сторони разом тестували роботаксі в Техасі та Флориді. Після ліквідації Argo AI випробування припинилися.
Підсумки
2022 рік виявився справді складним, але водночас багатим на цікаві та переломні події. Світ побачили безліч корисних ШІ-алгоритмів, що мають прикладне значення. Генератори, роботи, автоматизація — усе це активно впроваджується в повсякденне життя, роблячи його простішим, якіснішим та цікавішим.
Важко уявити, що на нас чекає у наступні 12 місяців. Ймовірно, геополітична напруга не знизиться. Очікувати пом’якшення відносин Китаю та США також не варто.
Очевидно, що протистояння художників та ШІ-генераторів вийде на новий рівень. Спільнота має провести величезну роботу, щоб довести, що люди та алгоритми можуть співіснувати в одному світі. Не останню роль у цьому відіграють уряди, чиїм завданням буде розсудити сторони, особливо в питаннях авторських прав.
При цьому 2022 рік показав, що потенціалу творчого розвитку людини немає меж. Чого вартий приклад з ChatGPT, коли винахідливість користувачів відкрила невідомі сторони алгоритму. Це зайве підтвердження того, що люди в стосунках із машинами залишаються на першому місці.
Читайте біткоїн-новини ForkLog UA у нашому Telegram — новини криптовалют, курси та аналітика.