Содержание

С вас вопросы, с нас ответы. Часть 2

Отвечаем на популярные вопросы по AI-агентам и их архитектуре
Консультирует:
Дмитрий Антипов, руководитель разработки AI-агентов в Группе Сбер (АБТ)

1. Что такое AI-агент: простое объяснение для новичков

AI-агенты — это та самая технология, которая заберет нашу работу. Шучу. Ну, почти.

На самом деле AI-агент — это такая концепция, в которой софт умеет не просто отвечать на вопросы, а реально делать дела. Мы ставим задачу на естественном языке — «просмотри эту задачу в гитлабе, посмотри код и найди несоответствия» и дальше агент сам решает, как ее достичь — и часто действительно может ее успешно решить. Именно поэтому вокруг агентов такой хайп — эта идея очень мощная и позволяет автоматизировать то, о чем раньше можно было только мечтать.

Но не все и не всегда. Агенты удивительно обманчивы — порог вхождения достаточно низкий, но дальше начинаются странные ошибки. Агент может как ни в чем не бывало час долбиться в API с 500 ошибкой. Или решить задачу творчески — настолько творчески, что потом полдня разбираешься, почему он выпилил весь PostgreSQL из проекта. Или зациклиться на мелочи и сжечь бюджет на токены, выясняя, нужна ли точка в конце комментария.

Под капотом у агента четыре штуки:
  1. мозги: языковая модель, которая делает всю работу
  2. память: чтобы не забывать, что уже сделал
  3. инструменты: все что угодно, что расширяет функциональность — API, функции
  4. цикл принятия решений: подумал → сделал → посмотрел на результат → скорректировал

Последнее — ключевое отличие от обычного софта: агент полноценно реагирует на происходящее, а не просто выполняет заранее написанные команды.

И если кратко, AI-агент — это способ делегировать задачи машине, которая достаточно умна, чтобы с задачей справиться, но недостаточно — чтобы знать, когда остановиться.

2. Какие задачи может решать AI-агент в бизнесе: реальные примеры

Сейчас на агентов хотят перевести вообще все, но это не совсем правильно. Самое сладкое место для AI-агентов — задачи, где есть прослойка общения между людьми. Техподдержка, обработка заявок, квалификация лидов — всё, где человек, А пишет человеку Б, а тот должен разобраться и ответить. Эффект легко измерить, цена ошибки невысока.

Классика — техподдержка. Клиент пишет «не работает интеграция с X». Агент может сам сходить в базу знаний, проверить статус сервисов, изучить историю клиента — и ответить с учетом контекста даже не на очень структурированный запрос. И 70−80% типовых обращений можно закрывать без человека. Считаем экономику и сразу же понимаем, почему агентов хотят все.

Здесь общий паттерн: понятный вход, понятный выход, измеримый результат. Было 1000 тикетов и 10 саппортов — стало 300 тикетов на людях и 3 саппорта на сложных кейсах и пост-валидации за автоматикой.

С творческими задачами сложнее. «Напиши стратегию», «придумай концепцию» — тут агенты тоже могут помочь, но нужна долгая настройка и специфическая разработка. Когда человеку непонятно, что значит «хорошо», то агенту сложно понять, достиг он цели или нет. И часто именно здесь начинается разочарование, потому что эта умная коробочка не может сходу решить все тем самым способом из нашей головы.

Если кратко: начинайте с рутины, где есть четкие правила и измеримый эффект. Творчество и вольности — потом.

3. Какие архитектуры AI-агентов наиболее эффективны для мультиагентных систем

Агенты хорошо работают с понятной изолированной задачей. «Проверь этот PR», «ответь на конкретный запрос в техподдержку», «найди информацию по запросу» — один агент, один контекст и один более-менее понятный результат. Но реальные бизнес-задачи редко бывают такими компактными. Бизнес часто хочет что-то сразу большое, например, «проанализируй все запросы и подготовь дашборд» — и тут одному агенту становится тяжело. Контекст не влезает, инструментов нужно много, и задача распадается на куски.

Отсюда появляется явление мультиагентности: мы разбиваем большую задачу на подзадачи и даем каждую отдельному агенту. Звучит просто, на практике — как обычно, от мелочей зависит все.

Глобально все сводится к трем подходам, но внутри каждого огромное количество нюансов.

Иерархия: менеджер и исполнители. Один агент («оркестратор») разбивает задачу, раздает воркерам и после собирает результат. Такое работает, когда декомпозиция очевидна, а задачи относительно изолированы. Но все ломается, когда менеджер неправильно понял задачу — тогда все воркеры дружно бегут делать совершенно не то.

Коллаборация: равноправные агенты. Работают параллельно, пишут в общую память и видят результаты друг друга. Хорошо для задач, где нужен какой-то консенсус, но очень сложно отлаживать — иногда агенты спорят вечно, а иногда соглашаются со всем подряд, даже с откровенным мусором.

Дебаты: адвокат, критик, судья. Один защищает решение, другой атакует, третий выносит вердикт. Мощно для критичных решений, но очень дорого и медленно.

Большинство мультиагентности начинает с иерархии — ее проще понять, а дальше — уже подстройка под задачу.

задай вопрос, а мы ответим

другие статьи