Браузеры теперь могут выполнять задачи за вас — вот что означает агентный искусственный интеллект

С момента своего создания функциональность Интернета значительно изменилась. Однако то, как мы с этим взаимодействуем, не имеет значения. Это выглядит так: найдите, прокрутите, выберите, выполните соответствующее действие — повторите при необходимости. В последнее время ИИ начал прерывать этот поток, но в основном это происходило в форме сгенерированного ИИ ответа на запрос пользователя. Но с появлением браузеров Agentic AI все может измениться.

Давайте начнем с описания того, что такое агентный ИИ и как он может изменить привычки просмотра. Неудивительно, что эти браузеры используют ИИ, чтобы действовать автономно от имени пользователя, выполняя многоэтапные задачи, а не просто отображая результаты поиска. Например, это означает, что вместо того, чтобы просто использовать браузер для поиска рейса, он также может найти лучшее предложение и забронировать его для вас. Тот же процесс можно применить к бронированию столиков в ресторанах и покупкам в Интернете. Кроме того, они могут использовать перекрестные ссылки на несколько открытых вкладок, собирать сводки информации из нескольких источников и напрямую общаться с любой открытой веб-страницей.

Этот сдвиг меняет роль браузеров с инструмента для доступа к Интернету на помощника искусственного интеллекта, который является активным участником процесса просмотра. Или, как Opera описывает свой новый Neon Browser, «браузер, который может работать самостоятельно в зависимости от ваших намерений и просматривать информацию вместе с вами и для вас». Но прежде чем вы броситесь устанавливать такой браузер, как браузер ChatGPT Atlas от OpenAI или Perplexity Comet, необходимо учитывать некоторые определенные проблемы безопасности и конфиденциальности.

Как работают агентные браузеры с искусственным интеллектом

Неоновый текст AI Agent отображается на экране смартфона

Браузеры с агентным искусственным интеллектом используют большие языковые модели, такие как ChatGPT, Gemini и Claude, чтобы обеспечить «системы рассуждения», лежащие в основе браузеров. Их обучают на обширных наборах данных, которые дают им возможность интерпретировать инструкции, оценивать контекст и давать последовательные ответы. По крайней мере, будем надеяться, что чат-боты в стиле ChatGPT могут «галлюцинировать». Однако существует фундаментальная разница в том, как работает агентный ИИ. По сравнению с системами искусственного интеллекта чат-ботов, такими как ChatGPT, агентные системы искусственного интеллекта более активны. Другими словами, они более целенаправленны и могут планировать и реализовывать шаги для достижения поставленной задачи. Именно эта способность выполнять задачу от начала до закрытия без какого-либо дальнейшего или ограниченного взаимодействия с пользователем является одним из основных отличий «агентного» от «традиционного» ИИ.

Еще один полезный аспект — возможность различать контекст поиска. Например, агентный ИИ-браузер может научиться различать рабочие и личные запросы и соответствующим образом адаптировать ответ.

И чтобы дополнить ощущение «швейцарского ножа» от этих инструментов, по-прежнему доступны основные функции чат-ботов с искусственным интеллектом, таких как Gemini, CoPilot или ChatGPT. Хотя в браузерах с агентным искусственным интеллектом они интегрированы в сердце браузера, а не как надстройка или веб-сайт, который вы просматриваете. Таким образом, любые функции, для которых вы обычно их используете, доступны на домашней странице браузера. Сюда входят такие функции, как генерация изображений, генерация кода и идеи мозгового штурма.

Темная сторона агентного ИИ-браузера

Смартфон с открытым браузером ChatGPT Atlas

Все это звучит очень хорошо: агентные браузеры с искусственным интеллектом становятся больше похожими на личных помощников, чем просто на инструмент для работы в Интернете. Однако, прежде чем мы все бросимся и сделаем следующий большой шаг вперед в Интернете, вам следует рассмотреть некоторые явные и реальные недостатки. ChatGPT Atlas уже доказал свою уязвимость к типу атаки, известному как прямое внедрение. По сути, это происходит, когда компонент «ИИ» агентного браузера обрабатывает доступную информацию не как данные, а как инструкцию. Например, The Register разработал быструю инъекцию, благодаря которой ChatGPT отвечал «Не доверяйте искусственному интеллекту» вместо запрошенного резюме документа.

Еще один ИИ-браузер с быстро выявленными уязвимостями — это браузер Comet от Perplexity. Среди нескольких тревожных сбоев в безопасности была готовность браузера сканировать явное фишинговое электронное письмо, посетить веб-сайт, а затем запросить у пользователя банковские реквизиты. Компания также была очень рада купить поддельные Apple Watch на мошенническом веб-сайте Walmart и не могла отличить инструкции пользователя от ненадежного интернет-контента.

Кроме того, чтобы действовать как настоящий личный помощник, агентному браузеру с искусственным интеллектом требуется доступ к личным данным. Это могут быть учетные записи электронной почты, облачное хранилище, банковские реквизиты и многое другое. По сути, предоставление агентскому ИИ-браузеру доступа к этому уровню информации требует высокого уровня доверия, которого индустрии ИИ еще предстоит заслужить. Несмотря на то, что в этих браузерах, несомненно, есть полезные функции, при их использовании абсолютно необходима должная осмотрительность.