Агентные пайплайны: ИИ выполняет многошаговые задачи сам

У ваших менеджеров уходит по 4 часа в день на сбор заявок из мессенджеров и прайсов - половина теряется. Или вы тратите полдня на согласование договора, хотя это можно сделать за 15 минут. Агентные пайплайны - это способ заставить ИИ выполнять задачи из нескольких шагов автономно, без вашего контроля. Никаких программистов, никаких курсов на полгода. Сегодня разберем, что это такое, чем отличается от обычного чат-бота и как собрать свой первый пайплайн на n8n за вечер.

Что такое AI-агент и чем отличается от чат-бота

Чат-бот и AI-агент решают принципиально разные задачи. Чат-бот - это интерфейс для диалога. Он получает запрос, генерирует ответ и завершает цикл. Его работа линейна: вопрос-ответ, вопрос-ответ. Даже продвинутые чат-боты с памятью и контекстом остаются пассивными инструментами - они ждут, пока пользователь скажет, что делать дальше.

AI-агент - это автономная система, которая не просто отвечает, а действует. У агента есть цель, инструменты и способность разбивать сложную задачу на последовательные шаги. Он сам решает, какие действия выполнить, в каком порядке, и когда привлечь внешние ресурсы - API, базы данных, калькуляторы, поисковые системы.

Ключевое отличие - инициативность. Чат-бот никогда не спросит: «Обнаружено, что вы не обновляли отчет три дня. Запустить формирование?» Агент может. Он отслеживает состояние задачи, делает промежуточные выводы и корректирует план по ходу выполнения.

Разберём на примере турагентства. Чат-боту говорят: «Найди отель и забронируй номер». Он выдаст список отелей и скажет: «Выберите». Агент сделает иначе: проверит календарь клиента, определит свободные даты, найдет отели с подходящим рейтингом, проверит наличие мест, забронирует, отправит подтверждение в календарь и сообщит результат. Все это - без дополнительных команд. (Пример, а не реальный кейс автора.)

Архитектурно агент состоит из трех компонентов: ядро принятия решений (LLM - большая языковая модель, та же нейросеть, что стоит за ChatGPT), набор инструментов (функции, API, плагины) и система памяти (краткосрочная - для текущей задачи, долгосрочная - для обучения на прошлых действиях). Чат-боту достаточно модели и контекстного окна.

Еще одно различие - обработка ошибок. Чат-бот при сбое выдаст сообщение об ошибке или попросит уточнить запрос. Агент попытается выполнить задачу другим способом: переключится на запасной API, переформулирует поисковый запрос, запросит недостающие данные у пользователя. Это устойчивость к сбоям.

Важно: агент не обязательно сложнее чат-бота в разработке. Сложность в проектировании логики принятия решений и границ автономии. Без четких ограничений агент может уйти в бесконечный цикл, потратить квоту API или принять неверное бизнес-решение.

На практике граница между чат-ботом и агентом размыта. Современные чат-боты с плагинами (например, ChatGPT с функциями) уже обладают агентными свойствами. Но полный AI-агент - это система, которая сама определяет, когда и какие инструменты использовать, и способна выполнять многошаговые задачи без вмешательства человека.

Компоненты агента: инструменты, память, планирование

Любой агентный пайплайн строится из трех базовых блоков. Без любого из них система перестает быть автономной и превращается либо в тупой калькулятор, либо в болтуна без возможности действовать.

Инструменты - это мост между LLM и внешним миром. Без них модель остается запертой в своей статистической вселенной. Инструменты бывают трех типов: чтение (поиск в интернете, запросы к API, чтение файлов), запись (отправка email, создание документов, изменение БД) и вычисления (запуск кода, математические операции, вызов внешних моделей). Критическое правило: каждый инструмент должен иметь четкое описание на естественном языке, понятное модели. Если вы назовете функцию send_email_v2(to, subject, body, cc), модель не поймет, когда ее вызывать. Правильное описание: «Отправляет email указанному получателю. Используй, когда нужно отправить письмо с подтверждением, отчетом или уведомлением». Модель принимает решение о вызове инструмента на основе этого описания, а не названия функции.

Память делится на три уровня. Рабочая память - это контекст текущего диалога. Она ограничена размером окна модели (обычно 8k-200k токенов - единиц текста, которые модель обрабатывает за раз). Сюда попадает история шагов, результаты выполнения инструментов и текущая цель. Краткосрочная память хранит информацию между сессиями: извлеченные факты, предпочтения пользователя, промежуточные выводы. Реализуется через векторные базы данных (Pinecone, Weaviate) или простые JSON-файлы с эмбеддингами. Долгосрочная память - это база знаний агента: документация, кодовая база, исторические данные. Она не меняется в процессе работы, но агент может к ней обращаться. Типичная ошибка - сваливать все в одну кучу. Агент тратит время на перебор нерелевантных данных. Правильная архитектура: рабочая память очищается после каждого цикла, краткосрочная индексируется по времени и контексту, долгосрочная - по тематическим кластерам.

Планирование - это механизм декомпозиции задачи. Без него агент будет делать первый попавшийся шаг и зацикливаться. Есть два подхода: статическое планирование и динамическое. В статическом агенте сначала генерируется полный план, потом выполняется. Это быстро, но ломается на неожиданных результатах. Динамическое планирование перестраивает план на каждом шаге, анализируя обратную связь от инструментов. Практический совет: для задач с четкими критериями успеха (например, «собрать данные из 10 источников и свести в таблицу») используйте статику. Для творческих или исследовательских задач (написать статью, провести анализ рынка) - динамику с чекпоинтами.

Связка работает так: планировщик получает задачу, разбивает на шаги. На каждом шаге агент выбирает инструмент, используя рабочую память для контекста и краткосрочную для извлечения релевантных фактов. Результат выполнения сохраняется обратно в память. Если шаг провалился - планировщик генерирует альтернативу. Если все шаги выполнены - агент собирает финальный ответ из накопленных данных.

Ключевой нюанс: не пытайтесь сделать все три компонента идеальными с первого раза. Начните с минимального набора инструментов (3-5 штук), текстовой памяти в виде лога и статического планировщика. Когда система начнет стабильно выполнять простые задачи, добавляйте сложность: векторную память, динамическое планирование, инструменты с побочными эффектами.

ReAct паттерн: агент думает, действует, наблюдает

ReAct (Reasoning + Acting) - это архитектурный паттерн, который превращает языковую модель из пассивного генератора текста в активного агента, способного выполнять многошаговые задачи. Основная идея: агент не просто выдает ответ, а циклически проходит три фазы - размышление (Thought), действие (Action) и наблюдение (Observation).

Как это работает на практике

Агент получает задачу. Вместо того чтобы сразу генерировать финальный ответ, он сначала формулирует, что нужно сделать. Это фаза Thought. Например: «Мне нужно узнать текущую погоду в Москве, но у меня нет этих данных в обучении. Значит, я должен вызвать внешний API».

Затем следует Action - конкретный шаг. Агент формирует команду для инструмента: вызов функции get_weather(city="Moscow"). Система выполняет этот вызов и возвращает результат в виде Observation: «Температура: -5°C, облачно».

Теперь агент снова переходит в фазу Thought: «Пользователь спросил, стоит ли брать зонт. Температура -5°C, облачно - осадков не ожидается. Значит, зонт не нужен». И выдает финальный ответ.

Почему это эффективно

ReAct решает ключевую проблему LLM - галлюцинации. Вместо того чтобы выдумывать факты, агент проверяет их через внешние источники. Каждый цикл Thought-Action-Observation создает цепочку доказательств, которую можно отследить и проверить.

Паттерн особенно полезен для задач, где требуется:

Доступ к актуальным данным (погода, курсы валют, новости)
Вычисления (агент вызывает калькулятор вместо того, чтобы считать самому)
Многошаговая логика (сначала найти ID пользователя, потом его заказы, потом статус каждого)

Типичная структура промпта для ReAct

You are an agent that thinks step by step.
Available tools: search_web, calculate, get_stock_price

For each step, output:
Thought: what you need to do
Action: tool_name(parameters)
Observation: result from tool
...repeat until done...
Final Answer: response to user

Ограничения и подводные камни

ReAct требует четко описанных инструментов. Если агент не знает, как вызвать API или какие параметры передавать, он сломается. Вторая проблема - зацикливание. Агент может бесконечно повторять один и тот же Action, получая одинаковый Observation. Решение - ограничение на количество шагов (обычно 10-15) и детектор повторяющихся паттернов.

Третий нюанс - стоимость. Каждый цикл Thought-Action-Observation генерирует новые токены. Для сложных задач счет может идти на тысячи токенов. Оптимизация: объединять несколько действий в один шаг, если они независимы.

Пример из реального кода

def react_agent(query):
 max_steps = 10
 context = [{"role": "user", "content": query}]
 
 for step in range(max_steps):
 response = llm.generate(context)
 if "Final Answer:" in response:
 return parse_final(response)
 
 action = parse_action(response)
 observation = execute_tool(action)
 context.append({"role": "assistant", "content": response})
 context.append({"role": "system", "content": f"Observation: {observation}"})
 
 return "Max steps reached"

ReAct - это фундамент, на котором строятся более сложные паттерны. Освоив его, вы получаете базовый строительный блок для любых агентных систем.

Claude Code как агент: реальные примеры задач

Claude Code превращает Claude в полноценного агента, способного автономно выполнять многошаговые задачи в терминале. Рассмотрим три конкретных сценария, где агентный пайплайн раскрывается на практике.

Пример 1: Автоматическое обновление прайс-листа с проверкой

Представьте, что у вас стройфирма. Менеджер пишет: «Обнови цены на все позиции в прайсе, увеличь на 10%, пересчитай итоговые суммы и проверь, что ни одна цена не стала ниже себестоимости».

Claude Code не просто делает замену через поиск и замену. Агентный пайплайн выглядит так:

Агент сканирует файлы прайсов, находит все позиции.
Для каждой позиции определяет текущую цену и себестоимость.
Выполняет увеличение на 10%.
Проверяет, что новая цена не ниже себестоимости. Если ниже - помечает для ручной проверки.
Пересчитывает итоговые суммы.
Сохраняет новый прайс и создает отчет об изменениях.

Результат: менеджер получает готовый прайс с проверкой, а не просто замену цифр.

Пример 2: Развертывание типового договора подряда с нуля

Задача: «Создай договор подряда на ремонт квартиры с тремя разделами: сроки, стоимость, ответственность. Добавь шаблон акта выполненных работ и смету».

Агентный пайплайн:

Claude Code создает структуру документа: преамбула, предмет договора, права и обязанности.
Генерирует текст договора с типовыми условиями, оставляя поля для заполнения.
Создает шаблон акта выполненных работ с перечнем работ и подписями.
Формирует смету с разбивкой по видам работ и материалам.
Проверяет, что все ссылки внутри документа корректны.
Экспортирует в формат DOCX или PDF.

Агент не просто генерирует шаблоны - он проверяет совместимость разделов и отсутствие противоречий в условиях.

Пример 3: Интеграция с CRM и обработка заявок

Запрос: «Напиши скрипт, который каждые 5 минут проверяет новые заявки из CRM, определяет их тип (консультация, заказ, жалоба), отправляет уведомление в Telegram нужному менеджеру и создает задачу в Trello».

Агентный пайплайн:

Claude Code изучает API вашей CRM (выполняет тестовый запрос, парсит ответ).
Создает скрипт на Python с использованием асинхронных запросов для неблокирующей работы.
Реализует логирование всех действий.
Пишет функцию отправки сообщений через Telegram Bot API - включает обработку ограничений и таймаутов.
Добавляет обработку краевых случаев: отсутствие интернета, некорректный JSON, изменение структуры ответа API.
Создает конфигурацию для запуска как сервиса.
Проверяет скрипт в действии: запускает, имитирует новую заявку, убеждается, что уведомление приходит.

Ключевое отличие Claude Code от простого генератора кода - способность выполнять команды, видеть результаты, анализировать ошибки и корректировать поведение без вмешательства человека. Агентный пайплайн здесь строится на цикле: действие - наблюдение - коррекция.

Multi-agent архитектура: оркестратор и исполнители

Multi-agent архитектура представляет собой распределенную систему, в которой несколько автономных агентов взаимодействуют друг с другом для достижения общей цели. В контексте агентных пайплайнов такая архитектура позволяет реализовать сложные задачи из нескольких шагов, делегируя каждый шаг отдельному агенту.

Оркестратор является центральным компонентом multi-agent архитектуры, ответственным за координацию и управление работой исполнителей. Оркестратор принимает входные данные, определяет последовательность шагов, необходимых для выполнения задачи, и распределяет эти шаги между исполнителями. Оркестратор также контролирует прогресс выполнения задачи, обрабатывает ошибки и исключения, и обеспечивает корректное завершение задачи.

Исполнители, в свою очередь, являются агентами, которые выполняют конкретные шаги задачи. Каждый исполнитель имеет определенный набор навыков и возможностей, позволяющих ему выполнять конкретные задачи. Исполнители могут быть реализованы как отдельные программные модули, сервисы или даже физические устройства. В зависимости от сложности задачи и требований к исполнителям, их можно категоризировать на различные типы, такие как:

Базовые исполнители: выполняют простые задачи, такие как чтение или запись данных.
Специализированные исполнители: выполняют сложные задачи, требующие определенных навыков или знаний, такие как обработка изображений или анализ текста.
Интеллектуальные исполнители: способны принимать решения и адаптироваться к меняющимся условиям, используя методы искусственного интеллекта и машинного обучения.

Для эффективного взаимодействия между оркестратором и исполнителями используется протокол обмена данными, который определяет формат и структуру сообщений, передаваемых между агентами. Этот протокол должен быть гибким и масштабируемым, чтобы обеспечить возможность добавления новых исполнителей и изменение существующих задач.

Реализация multi-agent архитектуры позволяет добиться нескольких преимуществ, включая:

Повышение гибкости и масштабируемости: добавление новых исполнителей или изменение существующих задач не требует значительных изменений в системе.
Улучшение производительности: распределение задач между несколькими исполнителями позволяет выполнять задачи параллельно, что ускоряет общее время выполнения.
Увеличение надежности: если один из исполнителей выходит из строя, оркестратор может перенаправить задачу на другой исполнитель, что минимизирует влияние на общую систему.

Разберём на примере онлайн-школы. У вас есть три агента: один проверяет домашние задания, второй формирует отчеты по успеваемости, третий отправляет уведомления ученикам. Оркестратор получает запрос «проверить все ДЗ за неделю и отправить отчет родителям». Он запускает первого агента для проверки, второго - для формирования отчета, третьего - для рассылки. Если один агент сбоит, оркестратор перезапускает его или использует запасной. (Пример, а не реальный кейс автора.)

n8n для агентных пайплайнов: без написания кода

n8n - это платформа визуальной оркестровки, которая позволяет строить агентные пайплайны без единой строки кода. В отличие от LangChain или AutoGPT, где логика прописывается в Python, n8n работает через drag-and-drop ноды и конфигурацию в YAML-подобном интерфейсе. Это делает его идеальным инструментом для предпринимателей, которые хотят быстро прототипировать многошаговые ИИ-сценарии без найма программиста.

Как устроен агентный пайплайн в n8n

Базовый блок - это последовательность нод, соединенных стрелками. Каждая нода выполняет одно действие: вызов LLM, парсинг ответа, запись в базу, отправку в Telegram. Агентность достигается за счет циклов и условных переходов. Например, нода Switch проверяет результат предыдущего шага и направляет поток в разные ветки. Если ИИ вернул status: error, пайплайн идет в ноду повторного запроса с уточнением. Если success - в ноду фиксации результата.

Конкретный пример: автономный сбор и анализ отзывов для шоурума

Триггер - нода Webhook или Schedule (запуск раз в час).
HTTP Request - забирает последние 50 отзывов с API маркетплейса.
OpenAI (Chat) - промпт: «Извлеки из каждого отзыва: тональность, ключевую проблему, оценку. Верни JSON-массив».
Set - нода преобразует ответ LLM в структурированные поля.
Switch - проверяет поле sentiment. Если negative - идет в ноду Slack (уведомление команде поддержки). Если positive - в ноду Airtable (запись в базу для дашборда).
Loop Over Items - если отзывов больше 50, пайплайн повторяет шаги 2-5 для следующей страницы.

Почему это работает без программирования

n8n предоставляет готовые ноды для всех популярных LLM: OpenAI, Anthropic, Google Gemini, Ollama (локальные модели). Для каждого вызова вы настраиваете системный промпт, температуру, максимальное количество токенов. Условная логика строится через визуальные правила: if {{ $json.sentiment }} === "negative". Никаких if-else в коде - только конфигурация.

Ключевые фишки для агентных сценариев

Sub-workflow - вложенный пайплайн, который можно вызывать как функцию. Например, «проверить качество ответа» - отдельный мини-пайплайн с LLM-валидатором.
Error Workflow - если нода упала, n8n запускает резервный сценарий: повтор через 30 секунд, смена модели, уведомление админу.
Human-in-the-loop - нода Wait приостанавливает пайплайн до ручного подтверждения. Полезно для шагов с высокими рисками (например, генерация контракта).
Binary Data - работа с файлами: загрузить PDF, отправить в LLM на анализ, сохранить результат.

Ограничения, которые нужно знать

n8n не предназначен для высоконагруженных систем реального времени. Максимум - десятки запросов в минуту на одном инстансе. Для сложной RAG с векторными базами придется использовать ноду HTTP Request к внешнему сервису (Pinecone, Qdrant) - встроенной векторной ноды нет. Также отсутствует нативная поддержка agent loops с рекурсией (когда агент сам решает, какие инструменты вызвать). Это решается через Code ноду с JavaScript, но тогда теряется принцип «без кода».

Когда выбирать n8n

Нужно быстро соединить LLM с CRM, Telegram, Google Sheets, Slack.
Бюджет на разработку ограничен, а типовые сценарии покрываются готовыми нодами.
Команда не хочет поддерживать Python-код и предпочитает визуальные изменения.

n8n закрывает 80% задач агентных пайплайнов малого и среднего бизнеса. Для остальных 20% - сложной маршрутизации, мультиагентных систем и кастомной обработки - потребуются фреймворки с кодом. Но начинать прототипирование стоит именно с n8n: за час вы соберете работающий пайплайн, который на Python писали бы два дня.

LangGraph для сложных сценариев с ветвлением

Линейные цепочки подходят для примитивных задач, но настоящая автономия требует принятия решений на лету. LangGraph решает эту проблему через графовые структуры с условными переходами. Ключевой механизм здесь - Conditional Edge, который направляет поток выполнения в зависимости от текущего состояния графа, а не по заранее жесткому расписанию.

Архитектура строится вокруг понятия State (состояния). Это общий контекст, доступный всем узлам, где накапливаются сообщения, результаты вызова инструментов и метаданные. Узлы представляют собой функции, принимающие состояние и возвращающие обновления. Логика ветвления реализуется через функцию маршрутизации. Она анализирует текущий State и возвращает строку с именем следующего узла. Например, если LLM-маршрутизатор в тегах ответа указал необходимость поиска, поток переходит в узел SearchTool. Если ответ готов, идет в узел FinalResponse.

Такой подход критичен для создания циклов и механизмов самокоррекции. В отличие от DAG (направленных ациклических графов), LangGraph поддерживает циклы. Агент может сгенерировать код, передать его в узел исполнения, получить traceback и через условное ребро вернуться на шаг генерации исправлений. Петля продолжается до тех пор, пока не выполнится условие выхода, например, успешный запуск или достижение лимита итераций.

Ветвление также позволяет реализовывать параллелизм. Граф может разветвлять поток на несколько независимых ветвей, где разные агенты обрабатывают одну задачу параллельно, а затем результаты сходятся в узле-синхрозаторе для агрегации. Библиотека берет на себя управление асинхронностью и сохранением целостности состояния при таких переходах.

Использование графов с ветвлением трансформирует LLM из простого генератора текста в оркестратор сложных процессов. Система перестает следовать линейному скрипту и начинает адаптивно выбирать путь решения, перебирая гипотезы и инструменты для достижения поставленной цели.

Разберём на примере проектного бюро. У вас есть задача: разработать дизайн-проект квартиры. Агент получает задание, разбивает его на этапы: замеры, планировка, визуализация, смета. На каждом этапе он может выбрать разные инструменты: для замеров - импорт из PDF, для планировки - вызов нейросети, для сметы - расчет по ценам из базы. Если на этапе планировки возникла ошибка (например, несоответствие нормативам), агент возвращается на шаг замеров и корректирует данные. (Пример, а не реальный кейс автора.)

Безопасность агентов: что разрешать, что нет

Агентный пайплайн работает автономно, но автономность не означает вседозволенность. Каждый шаг, который ИИ выполняет без вашего контроля, - потенциальная точка отказа. Безопасность строится на четырех принципах: минимальные привилегии, изоляция среды, верификация действий и аудит.

Минимальные привилегии. Агенту нужно ровно столько прав, сколько требуется для текущей задачи, и ни на йоту больше. Если агент пишет код - дайте доступ только к репозиторию, а не к продакшн-базе данных. Если агент отправляет email - разрешите только шаблонные письма, без вложений и массовой рассылки. Создайте профили разрешений: «только чтение», «запись в staging», «выполнение скриптов в песочнице». Никогда не используйте учетную запись администратора.

Изоляция среды. Агент должен работать в контейнере или виртуальной машине, которая не имеет доступа к внутренней сети, файловой системе хоста и конфиденциальным данным. Если агент запускает код - используйте sandbox-среду с ограничением по времени, памяти и сетевым запросам. Любой внешний вызов (API, база данных, файловая система) должен проходить через прокси-слой, который логирует и фильтрует запросы. Пример: агент генерирует SQL-запрос - прокси проверяет, что это SELECT, а не DROP TABLE.

Верификация критических действий. Разделите действия на три категории: безопасные (чтение файлов, поиск информации), рискованные (запись данных, отправка сообщений) и опасные (удаление, изменение конфигурации, финансовые операции). Для безопасных - полная автономия. Для рискованных - подтверждение человека через кнопку «Одобрить» в интерфейсе. Для опасных - блокировка по умолчанию, только ручное разрешение с указанием причины. Никогда не давайте агенту право удалять данные без двухфакторного подтверждения.

Контроль цепочки вызовов. Агент может выполнять 10 шагов, но каждый шаг должен проверяться на соответствие исходной цели. Если агент начал задачу «найти контакты клиента», а на третьем шаге пытается скачать файл с сервера - это аномалия. Встройте детектор отклонений: сравнивайте текущее действие с разрешенным списком операций для данной задачи. При несовпадении - останавливайте пайплайн и запрашивайте объяснение.

Лимиты и квоты. Установите жесткие ограничения: максимум 50 API-вызовов за задачу, не более 10 МБ скачанных данных, таймаут 30 секунд на шаг. Если агент превышает лимит - пайплайн завершается с ошибкой. Это защищает от бесконечных циклов и утечек данных.

Аудит и логи. Каждое действие агента должно быть записано: время, тип операции, входные и выходные данные, статус выполнения. Логи храните в неизменяемом хранилище (append-only). Раз в неделю запускайте автоматическую проверку логов на аномалии: необычная последовательность вызовов, доступ к запрещенным ресурсам, попытки обойти ограничения.

Что запрещать категорически: выполнение shell-команд с правами root, прямой доступ к продакшн-базам, отправку файлов на внешние серверы, изменение прав доступа, запуск дочерних процессов без контроля, использование eval() или exec() в коде. Эти операции должны быть заблокированы на уровне инфраструктуры, а не только в коде агента.

Безопасность агента - это не разовая настройка, а непрерывный процесс. Каждое новое действие, которое вы разрешаете агенту, должно пройти через призму: «Что самое плохое может случиться, если этот шаг пойдет не по плану?» Если ответ пугает - не разрешайте.

Частые вопросы

Агент может сам себя улучшать?

Агент может сам себя улучшать за счет накопления опыта и обновления своих знаний и навыков. Это происходит через процесс обучения и адаптации к новым ситуациям и задачам. Благодаря этому, агент может совершенствовать свои действия и принимать более эффективные решения. В итоге агент становится автономнее и эффективнее в задачах.

Сколько инструментов может использовать один агент?

Один агент может использовать несколько инструментов для выполнения задачи. Теоретически ограничений нет, но на практике рекомендуется не более 10-15 инструментов на одного агента. Большее количество усложняет выбор и увеличивает вероятность ошибок. Если требуется больше, лучше разбить задачу на нескольких агентов с разными наборами инструментов.

Что делать, если агент зациклился?

Установите лимит шагов (например, 10-15) и детектор повторяющихся действий. Если агент повторяет один и тот же шаг более 3 раз - останавливайте пайплайн и переходите к запасному сценарию. В n8n это настраивается через ноду Switch и счетчик итераций.

Сколько стоит запустить агентный пайплайн?

Стоимость складывается из вызовов к LLM (цены OpenAI или Anthropic) и хостинга n8n (бесплатно на своем сервере или от $20/мес за облачный). Для малого бизнеса типичный бюджет - $50-200 в месяц на API-запросы. Начать можно с бесплатных лимитов OpenAI и n8n Community Edition.

Какой инструмент выбрать для начала?

Если у вас нет программиста - n8n. Если есть технический менеджер, который может написать пару скриптов - Claude Code. Если задача сложная с ветвлением и циклами - LangGraph, но это потребует разработчика. Для 90% бизнес-задач хватит n8n.

Что делать дальше: конкретный план на неделю

Сегодня: Зарегистрируйтесь в n8n (бесплатно на n8n.io или установите через Docker на свой сервер). Пройдите туториал «Создать первый workflow» - 30 минут.
Завтра: Соберите пайплайн «Заявка из Telegram в Google Sheets»: триггер Webhook -> парсинг -> запись в таблицу. Проверьте на тестовых данных.
Через 2 дня: Добавьте LLM-ноду OpenAI. Настройте промпт для классификации заявок (срочная/обычная) и автоматического ответа.
Через неделю: Замените ручную обработку заявок на агентный пайплайн с уведомлениями в Telegram. Замерьте экономию времени.

Не пытайтесь автоматизировать все сразу. Выберите одну рутинную задачу, которая съедает больше всего времени у вас или ваших сотрудников, и соберите под нее пайплайн. Через неделю вы удивитесь, как жили без этого.

AI Компас (t.me/kosmoslab_ai) - канал для предпринимателей в РФ и СНГ, которые применяют AI в своём бизнесе без программиста. Разбираем инструменты и схемы - без курсов и теории.