ИИ для автоматизации процессов: RAG, ИИ-агенты, стоимость ресурсов
FAQ по ИИ-автоматизации бизеса
Исследование McKinsey & Company говорит, что в 2025 году 88% компаний регулярно используют ИИ хотя бы в одной бизнес-функции. Примерно треть компаний вышла на стадию масштабирования ИИ по организации, остальные находятся на уровне экспериментов и пилотов. Масштабирование заметно чаще происходит у крупных компаний с выручкой больше пяти миллиардов долларов.
В России картина похожа на глобальную. Cемь из десяти компаний уже используют ИИ для тех или иных задач, следует из опроса VK и Prognosis. 14% работают на своих решениях, 44% полагаются на готовые продукты, а 42% комбинируют собственные и внешние разработки.
В чем плюсы ИИ для автоматизации процессов?
Классическая автоматизация (правила, скрипты, софт вроде BPM, RPA и триггеров в CRM или ERP) работает по жестким правилам. Простыми словами, «если А, делаем Б». Она плохо справляется с живым текстом, нестандартными кейсами и контекстом.
Кроме нее компании уже много лет используют «классический ИИ». Например, компактные модели рекомендаций, прогнозов, компьютерного зрения. Они не требуют дорогих видеокарт, могут работать на обычных серверах и дают львиную долю экономического эффекта: помогают считать спрос, цены, нагрузки, анализировать документы и сенсоры. Классический ИИ закрывает множество узких, хорошо формализованных задач.
Генеративный ИИ и агентные решения закрывают кейсы посложнее, где раньше почти всегда требовалось участие человека и работа с неструктурированным текстом. Они расширяют границы того, что вообще можно отдать машине. Например, работу с текстом, контекстом и нестандартными управленческими решениями.
Когда ИИ для автоматизации задач не нужен?
Во-первых, когда процесс уже прост, стабилен и хорошо описывается правилами. Например, если задача сводится к «если А, делаем Б», правила почти не меняются, а входные данные структурированы. В таких кейсах достаточно классической автоматизации или простых моделей на центральном процессоре (CPU). Генеративный ИИ и агенты лишь добавят сложности, почти не увеличивая ценность.
Во-вторых, если обращений мало, процесс редкий или нерегулярный. На маленьких объемах стоимость внедрения, поддержки и инфраструктуры может перекрыть потенциальную экономию на человеко-часах. Проще оставить задачу специалисту или встроить ее в уже существующий бизнес-процесс без генеративного ИИ.
В-третьих, когда нет данных или они в плохом состоянии. Для качественной работы ИИ (и классического, и генеративного) нужны тексты обращений, история решений, база знаний, регламенты. Отдельный случай — когда сам процесс еще не стабилен. Например, бизнес меняет продукт, регламенты меняются или роли в команде не устоялись.
Как безопасно передавать ИИ внутренние данные компании?
Есть класс задач, где ИИ справляется без внутренних данных компании. Например, поправить орфографию, сгенерировать идею или шаблонный ответ по общим правилам, автоматизировать реакцию на смену статуса в BPM или RPA. Здесь не нужны факты о компании: моделям хватает публичных знаний и контекста из самого запроса.
Как только процесс упирается в корпоративные нормы и фактические данные из систем компании, без внутреннего контекста не обойтись. Иногда достаточно минимального контекста. Например, кусок договора, карточка контрагента, выдержка из регламента.
Чем точнее настроен контекст и права, тем надежнее работает ИИ. Поэтому на практике корпоративные знания передают модели с помощью нескольких методов. Например, численные и оперативные данные можно подать через прямые запросы к API или SQL, а текстовые знания — через RAG.
Что такое RAG-система?
RAG (Retrieval-Augmented Generation, поиск по базе знаний с генерацией ответов) — это способ подавать модели ровно те фрагменты внутренних документов, которые нужны ИИ для ответа или действия здесь и сейчас. По сути, это прослойка между хранилищами компании и моделью.
Система режет документы и файлы на смысловые куски и индексирует их, выполняет семантический поиск по входному запросу, подставляет найденные фрагменты в контекст модели и формирует ответ с опорой на найденные фрагменты, обычно со ссылками на источники внутри базы знаний.
Это особенно полезно в процессах, где какой-то шаг требует обоснования. Например, разбирать входящие письма и договоры и составлять краткое содержание по пунктам, отвечать сотрудникам и клиентам на основе базы знаний, проверять соответствие политикам или рекомендовать действия по плейбукам в службе поддержки.
Что делают ИИ-агенты для бизнеса?
В любом процессе есть исполнители, даже если он автоматизированный. Ими могут быть люди, программы с жесткой логикой вроде BPM и ИИ-агенты. Люди принимают решения сами, программные конвейеры строго следуют правилам «если А, то Б». ИИ-агенты занимают середину. Они понимают цель, планируют последовательность шагов, выбирают инструменты (например, API, RPA-роботы, почта, календарь, CRM или ERP), выполняют действия, проверяют результат и при необходимости эскалируют.
Агенты могут работать в одиночку или вместе. В мультиагентной системе они передают друг другу работу по ролям, как в отделе. Например, один извлекает данные, второй принимает решение по регламенту, третий оформляет и рассылает. Такой подход позволяет автоматизировать процесс целиком.
Например, ИИ-платформа Flexar позволяет запускать ИИ-агентов для суммаризации отзывов, обработки договоров и других задач. Агенты разрабатываются индивидуально под потребности заказчиков.
Где размещают ИИ и его компоненты?
Стоимость и затраты на внедрение ИИ зависят от типа развертывания: где именно размещать компоненты из стека автоматизации. Например, модели для инференса, слой знаний, коннекторы к данным и системам, ИИ-агенты. Основных вариантов четыре:
- Собственное оборудование. Серверы и видеокарты у компании в дата-центре. Это самый дорогой вариант, но он дает самый высокий уровень контроля над железом и данными.
- Аренда выделенного физического сервера (bare metal) у хостингового провайдера. С выделенным физическим сервером у провайдера уровень контроля над данными и инфраструктурой остается высоким. Стоит дешевле, чем покупать свое железо.
- Облачные видеокарты (IaaS). Компания не арендует отдельный физический сервер целиком, а использует ресурсы облака по мере необходимости. Это снижает стоимость по сравнению с предыдущими вариантами, но и контроль над самим железом ниже: инфраструктурой управляет облачный провайдер.
- Облачные большие языковые модели как управляемый сервис (Managed LLM API). Компания отправляет запросы провайдеру модели и платит за использование, в том числе за количество токенов. Контроль над железом и деталями инфраструктуры минимальный. Вместе с этим снижается и контроль над тем, где именно и как обрабатываются данные. Обычно это самый дешевый вариант входа.
Во многих сценариях, где нет персональных данных, но есть запрет на трансграничную передачу (когда данные обрабатываются на серверах, которые находятся за пределами страны компании), все эти опции потенциально приемлемы. Могут быть и гибридные решения. Когда в процессе фигурируют персональные и чувствительные данные, компании чаще выбирают между собственным железом и арендой bare metal.
Сколько стоит использование ресурсов?
Кроме типа развертывания на экономику ИИ-автоматизации влияет стоимость единичного обращения к системе. Она зависит от архитектуры конкретного решения: насколько оно типовое, сколько разных сетей под капотом требуют инференса.
К этому добавляются параметры бизнеса: число пользователей, месячный объем взаимодействий, RPS и прочие характеристики нагрузки. Кроме того, есть рынок провайдеров моделей. Можно сравнить стоимость в рублях за миллион токенов у разных игроков, от российских облачных платформ (Cloud.ru, Яндекс, Сбер и других) до нишевых поставщиков вроде CLM. Например, цену чат-модели можно рассчитать по формулам:
В каждом конкретном случае на итог влияют скидки от провайдера, возможность частично использовать более дешевые модели или более дешевые карты, перераспределение нагрузок. За счет этого реальная стоимость может получиться заметно ниже ориентировочного расчета. Или, наоборот, неожиданно выше.


