Google посилила боротьбу з маніпуляціями у ШІ-пошуку
Корпорація Google посилила політику використання пошукових інструментів на базі ШІ після публічного експерименту журналіста BBC Томаса Жермена.
Ще у лютому Жермен помітив, що результатами пошукової видачі штучного інтелекту можна маніпулювати. Цим зловживають недобросовісні компанії у власних інтересах, зазвичай з рекламною метою.
«Ми виявили приклади, коли ChatGPT, Gemini та ШІ-відповіді у верхній частині результатів пошуку Google використовувалися для надання упереджених відповідей на такі серйозні теми, як здоров’я та особисті фінанси», — написав він.
За 20 хвилин журналісту вдалося «обманути» нейромережу. У публічних результатах Gemini від Google називала Жермена «чемпіоном світу з поїдання хот-догів».
«Жарт дурний. Проблема серйозна», — додав автор BBC.
Ще у квітні Google повідомила, що вже фіксує непрямі атаки «інʼєкції промпта» (prompt injection). Однак нещодавній випадок змусив компанію уважніше поставитися до проблеми.
У компанії окремо згадали SEO-сценарії, коли власники вебсайтів намагаються змусити ШІ рекомендувати саме їхній бізнес або продукт.
У Google офіційно прив’язали подібні практики до своєї антиспам-політики. Тепер спамом вважається не лише маніпулювання ранжуванням посилань, а й спроба вплинути на генеративні відповіді.
Таким чином сайти, що вставляють приховані інструкції заради AI Overviews або AI Mode, можуть понизити у видачі або взагалі бути виключені з результатів пошуку. Фактично Google поширює попередні принципи боротьби з SEO-маніпуляціями на ШІ-пошук (AIO/GEO).
Що таке непряма «інʼєкція промпта»
З технічної точки зору непряма «інʼєкція промпта» — це опосередковане введення підказок для моделі.
На відміну від класичного зламу ШІ, коли користувач напряму намагається обійти обмеження, тут шкідлива інструкція приховується всередині зовнішнього джерела даних:
- вебсторінки;
- документа;
- листа;
- іншого контенту, який ШІ використовує під час формування відповіді.
У Google називали непряму «інʼєкцію промпта» однією з ключових загроз для агентних ШІ-систем. Проблема в тому, що модель не завжди здатна надійно відокремити запит користувача від шкідливої інструкції.
У документації з безпеки Gemini зазначається, що стійкість до таких атак неможливо забезпечити одним способом. Компанія робить ставку на комбінацію фільтрації контенту, коригування поведінки моделей і постійного тестування нових сценаріїв маніпуляції.
Водночас Google не забороняє використання штучного інтелекту чи автоматизації як таких. Позиція компанії зводиться до того, що ШІ-контент припустимий, доки він створюється задля користі, а не для маніпулювання.
Нагадаємо, у травні корпорація представила Gemini 3.5 Flash — «найпотужнішу» ШІ-модель у сфері програмування та створення агентів.