Менеджер турагентства тратит 2-3 часа на каждого клиента: открыть 5 поисковых систем, собрать варианты по бюджету и датам, отсеять перелёты длиннее 8 часов, оформить в читаемое письмо. На горячем сезоне очередь растягивается на дни. Клиент ждёт, менеджер тонет в однотипных задачах, новые заявки копятся. При этом сама работа несложная - она просто долгая и повторяющаяся.
AI-агент делает именно такую работу. Не генерирует текст «по памяти» как обычный ChatGPT - а идёт в реальные системы, собирает актуальные данные, сравнивает и возвращает результат. Разница не в умности модели, а в том, как она устроена: агент действует, а не только отвечает.
Чат-бот и агент: в чём принципиальная разница
Обычный чат-бот работает по схеме «вопрос - ответ». Спросил - получил текст. Всё, что дальше - твоя работа: проверить, уточнить, применить.
Агент работает иначе. Получив задачу, он сам разбивает её на шаги, вызывает нужные инструменты, смотрит на результаты и решает - хватит этого или надо копнуть дальше. Человек задаёт задачу и получает итог. Промежуточные шаги агент проходит сам.
Конкретный пример из турагентства. Спросить ChatGPT «найди туры в Турцию на август на 4 человека, бюджет 250 тысяч» - получишь общий текст из обучающих данных, которые могут быть годичной давности. Спросить агента с доступом к реальным поисковым системам - он откроет Слетать.ру, B2B.trip, TourVisor (или другие системы, к которым его подключили), сравнит реальные предложения с актуальными ценами и вернёт конкретный список. Это принципиальная разница для бизнеса, где важна свежесть данных.
Ключевое свойство агента - способность делать вызовы к инструментам (внешним сервисам, базам данных, сайтам) и использовать полученные результаты для принятия следующего шага. Увидел данные из поисковика - решил: достаточно или нужен ещё запрос? Именно этот цикл превращает LLM (Large Language Model, большую языковую модель - то, что работает внутри ChatGPT) в агента.
Цикл «воспринять - подумать - сделать»: как это работает внутри
Большинство агентов работают по одному и тому же трёхфазному циклу. Понимание этого цикла помогает правильно ставить задачи и объяснять подчинённым, почему агент ведёт себя так, а не иначе.
Воспринять - агент получает входные данные: текст задачи, результаты предыдущих шагов, ответы от внешних сервисов, содержимое файлов. Всё это попадает в «рабочую память» модели.
Подумать - модель строит рассуждение. Какой инструмент вызвать? С какими параметрами? Или задача уже выполнена? В зависимости от настройки это может быть короткий внутренний вывод или развёрнутая цепочка рассуждений.
Сделать - агент выполняет действие: вызывает функцию, делает запрос к внешнему сервису, запускает код, сохраняет результат. После этого цикл начинается заново.
Пример сценария для турагентства: клиент пишет в WhatsApp «семья из 4 человек, бюджет 250 тыс., две недели в августе, тёплое море, лучше без перелёта 8+ часов». Агент:
- Воспринимает параметры: 4 чел., бюджет, даты, регион, ограничение по перелёту
- Думает: какие поисковые системы запросить, как сформулировать фильтры
- Делает: запрашивает 3 системы (например, TourVisor, Слетать.ру, прямую выгрузку туроператора)
- Воспринимает результаты: 40+ вариантов с ценами и наличием мест
- Думает: отфильтровать по бюджету, убрать перелёты длиннее 8 ч., оценить рейтинги отелей
- Делает: формирует короткий список из 5 туров с плюсами и минусами каждого
- Возвращает менеджеру готовый ответ - за 30-90 секунд вместо 2-3 часов
Ниже - простейший агент с доступом к поиску. Параметр verbose=True позволяет видеть каждый шаг рассуждений - полезно на старте, чтобы понять как он «думает»:
from langchain.agents import AgentExecutor, create_react_agent
from langchain_openai import ChatOpenAI
from langchain.tools import DuckDuckGoSearchRun
llm = ChatOpenAI(model='gpt-4o-mini')
tools = [DuckDuckGoSearchRun()]
agent = create_react_agent(llm, tools, prompt)
executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
result = executor.invoke({'input': 'Туры в Турцию на август 2025, 4 человека, бюджет до 250 тыс. руб.'})
# Вывод показывает каждый шаг: рассуждение -> действие -> наблюдение -> итог
# Обычная цепочка из 3-5 итераций: 5-15 секунд при GPT-4o-mini
Инструменты: что агент умеет делать руками
Инструменты - это то, что делает агента практически полезным для бизнеса. Без инструментов это просто умный чат-бот, который отвечает из головы. С инструментами агент может искать информацию, работать с файлами, обращаться к вашим системам и выполнять вычисления.
Для турагентства типичный набор инструментов выглядит так:
- Запрос к поисковым системам туров (Слетать.ру, TourVisor, B2B.trip) - находит актуальные предложения с ценами
- Проверка наличия мест и дат вылета - не предлагает тур, которого уже нет
- Чтение PDF с условиями туроператора - сравнивает страховки и условия аннуляции
- Запись в CRM - сохраняет подобранные варианты к карточке клиента
- Отправка сообщения в WhatsApp или Telegram - возвращает результат клиенту
С технической стороны: каждый инструмент описывается как функция с именем, описанием и параметрами. Модель читает описание и решает, когда и как его вызвать. Реальный код выполняет программный фреймворк (LangChain, LlamaIndex или другой), а не сама модель.
Описание инструмента критично: чем оно точнее, тем реже агент ошибается в выборе. Сравните два варианта:
from langchain.tools import tool
@tool
def search_tours(query: str) -> str:
"""
Найти туры по запросу клиента в системе TourVisor.
Передавай сюда: страну, город вылета, даты, количество туристов, бюджет.
Пример: 'Турция, Москва, 10-24 августа, 4 человека, до 250000 руб.'.
Используй этот инструмент только для поиска актуальных туров, не для справочной информации.
"""
# реальный вызов API TourVisor
return "Найдено 23 тура, 5 наиболее подходящих: ..."
# Расплывчатое описание 'searches for tours' хуже конкретного выше.
# Модель принимает решение о вызове именно по тексту описания.
Один прогон агента с 4-5 вызовами инструментов на GPT-4o стоит около 2-5 центов в зависимости от объёма контекста. Для задачи, которую менеджер делал бы 2 часа - экономика очевидна.
Память агента: три типа и зачем они нужны в работе с клиентами
Без памяти агент начинает каждый разговор заново. Для турагентства это означает: клиент написал второй раз - агент не помнит, что он уже искал месяц назад, какой отель нравится, с кем летит и какие были договорённости. Три типа памяти решают разные проблемы.
Контекстная память - это история текущего разговора. Самый простой тип: агент видит всю переписку в рамках одной сессии. Ограничение - длина «окна» (у GPT-4o это примерно 128 тысяч слов, у Claude 3.5 Sonnet - 200 тысяч). При долгих переговорах с клиентом историю приходится сжимать.
Эпизодическая память - сохранение прошлых взаимодействий во внешнем хранилище. Агент может вспомнить: «этот клиент уже летал через нас в 2024-м, предпочитает отели 5* с питанием all-inclusive, не любит перелёты с пересадками». Технически это база данных с поиском по прошлым сессиям.
Семантическая память - база знаний, которую агент использует как справочник. В турагентстве это может быть: условия всех туроператоров, правила получения виз, список проверенных отелей с вашими комментариями, история рекламаций. Это система RAG (Retrieval-Augmented Generation - поиск с дополнением): агент получает вопрос, ищет в вашей базе документов, включает нужные фрагменты в контекст. Большинство рабочих агентов используют контекстную и семантическую память вместе.
Как агент думает: ReAct, цепочка мыслей и другие подходы
То, как агент организует рассуждения, напрямую влияет на качество ответа. Три основных подхода.
ReAct (Reasoning + Acting, рассуждение + действие) - самый распространённый. Агент чередует текстовые рассуждения и вызовы инструментов. Каждый шаг мотивирован явным рассуждением:
Рассуждение: клиент хочет тёплое море в августе без длинных перелётов. Проверю Турцию и Египет.
Действие: search_tours('Турция, Москва, 1-15 августа, 4 человека, до 250000 руб.')
Наблюдение: найдено 23 тура, дешевле 250 тыс. - 8 вариантов, из них без ночных стыковок - 5
Рассуждение: достаточно вариантов, можно формировать список с плюсами/минусами
Итог: [короткий список 5 туров с описанием]
Chain-of-Thought (цепочка мыслей) - модель разворачивает рассуждение пошагово перед финальным ответом. Хорошо работает для задач с промежуточными вычислениями - например, сравнение стоимости тура с учётом страховки, визы и трансфера.
Tree-of-Thoughts (дерево мыслей) - агент рассматривает несколько ветвей рассуждения параллельно и выбирает наилучшую. В 3-5 раз дороже по стоимости запросов. Имеет смысл только для стратегических задач с неочевидным решением.
Для большинства задач в малом и среднем бизнесе ReAct достаточно.
Ограничения и риски: что важно знать до внедрения
Понимание рисков помогает правильно выстроить работу с агентом в компании и не наступить на типичные грабли.
Галлюцинации в агентном контексте опаснее, чем в чат-боте. Агент не только генерирует неверный текст - он действует на его основе. Для турагентства это означает: может обратиться к несуществующему API, передать неверные параметры в поиск, сохранить ошибочные данные в карточку клиента.
Практические меры защиты:
- Ограничение числа шагов (не более 10-15 за один прогон)
- Ограничение времени на весь прогон (60-120 секунд для интерактивных задач)
- Проверка результатов инструментов перед передачей на следующий шаг
- Точка подтверждения человека (HITL - Human-In-The-Loop, человек в контуре управления) для необратимых операций: бронирование тура, отправка счёта клиенту, запись в базу
Бесконечные циклы. Поисковая система вернула ошибку, агент пробует снова, снова ошибка. Без явного ограничения шагов такой цикл тратит токены и деньги. Параметр max_iterations должен быть выставлен всегда.
Изоляция инструментов. Агент с доступом к файловой системе и интернету одновременно - широкая поверхность для ошибки или атаки. Для рабочих систем рекомендуется минимальный набор инструментов и изолированная среда выполнения.
Реальные примеры: три типа агентов, которые уже работают в бизнесе
Агент-исследователь получает параметры клиента и собирает материал: ищет туры, читает условия туроператоров, суммаризирует, структурирует. Типичная цепочка - 8-15 вызовов инструментов, общее время 30-90 секунд. Стоимость одного прогона на GPT-4o - 10-30 центов. Такой агент за полторы минуты делает то, что менеджер делал 2-3 часа.
Агент-переговорщик ведёт переписку с клиентом по заданному сценарию: уточняет параметры тура, отвечает на типовые вопросы (нужна ли виза, что входит в страховку, какие документы для детей), согласовывает детали. Менеджер подключается только на финальном этапе - подтвердить бронирование и принять оплату.
Агент-координатор принимает большую задачу (например, организовать групповой тур на 20 человек), разбивает её на подзадачи, делегирует специализированным агентам, собирает результаты. Это уже мультиагентная архитектура (multi-agent): один агент управляет другими, как руководитель командой. Для старта такое не нужно, но понимать, куда ведёт эволюция, полезно.
Когда агент не нужен
Агентная архитектура добавляет сложность: больше стоимость запроса, больше задержка, больше точек отказа. Не каждая задача требует агента.
Простой вызов языковой модели лучше, когда:
- задача решается за один проход (перевод письма, краткое изложение, классификация заявки)
- нет нужды в актуальных данных из внешних систем
- нужна предсказуемая скорость ответа меньше 2 секунд
- бюджет на запросы строго ограничен
Агент оправдан, когда:
- задача требует нескольких шагов с промежуточными результатами
- нужны внешние данные (поисковые системы, базы данных, API туроператоров)
- нужна итерация «нашёл - проверил - уточнил - выдал»
- задача слишком большая для одного вопроса
Практическое правило: если можно решить задачу одним точным вопросом - используйте обычную модель. Если задача требует нескольких шагов с разными источниками данных - агент.
Типичные ошибки при запуске
Не ограничивать число шагов. Агент застрял в цикле ошибок - счёт за запросы растёт, результата нет. Параметр max_iterations обязателен.
Давать расплывчатые описания инструментам. Модель выберет не тот инструмент или вызовет его с неверными параметрами. Описание должно объяснять не только что делает инструмент, но и когда его использовать.
Не добавлять точку подтверждения для необратимых действий. Агент забронировал тур не на те даты или отправил счёт не тому клиенту. Для любого действия, которое нельзя отменить за 5 секунд, нужна пауза с подтверждением менеджера.
Запускать агента там, где достаточно обычной модели. Лишняя задержка и стоимость без дополнительной пользы.
Частые вопросы
В чём разница между агентом и просто ChatGPT с доступом к поиску?
ChatGPT с Browsing делает один поиск и отвечает. Агент использует результаты поиска, чтобы принять решение о следующем шаге: достаточно этого или нужен ещё один запрос с уточнёнными параметрами? Самостоятельные решения о следующем шаге - ключевое свойство.
Может ли агент работать с нашими внутренними системами, а не только интернетом?
Да. Агент работает с любыми инструментами, к которым ему дали доступ: ваша CRM, база туров, 1С, Google Sheets, WhatsApp Business API. Интернет нужен только если задача требует внешней информации.
Как агент понимает, что задача выполнена?
Обычно модель сама решает, когда выдать итоговый ответ вместо очередного вызова инструмента. Для надёжности добавляют явные критерии завершения в инструкцию - например, «считай задачу выполненной, когда собрано не менее 3 и не более 7 актуальных вариантов тура».
Что такое «точка подтверждения человека» и зачем она агенту?
HITL (Human-In-The-Loop, человек в контуре управления) - момент, когда агент останавливается и ждёт подтверждения перед следующим действием. Критично для необратимых операций: бронирование, отправка счёта, запись в базу. Без этого агент может совершить необратимое действие на основе ошибочного вывода.
Насколько агент надёжнее обычной модели в сложных задачах?
Для задач с актуальными данными или итерацией - существенно надёжнее. Для задач, где нужен хороший текст - не надёжнее, только дороже и медленнее. Надёжность зависит от качества инструментов и ограничений на число попыток.
Что внедрить первым
Агент - это не магия. Это инструмент автоматизации многошаговых задач с доступом к внешним данным. Там, где это нужно, он работает в десятки раз быстрее человека. Там, где не нужно, только добавляет сложность.
Для турагентства первый практический шаг - агент подбора туров с доступом к одной-двум поисковым системам. Готовые решения: n8n + OpenAI API, Make.com + GPT-4o, или более простые варианты вроде Dify (есть бесплатный план). Менеджер задаёт параметры клиента, агент собирает варианты, менеджер выбирает финальный список и отправляет клиенту. Это реальная задача, которую можно настроить за 2-8 часов без программиста.
Следующий уровень - управляемые агенты через граф состояний: /uchebnik/langgraph-graf-agenty - инструмент промышленного уровня для оркестрации агентных потоков с управляемым состоянием и точками остановки.
Подпишитесь на AI Компас https://t.me/kosmoslab_ai - там разбираем, как предпринимателю из РФ и СНГ применять AI в своём бизнесе без программиста: конкретные схемы, реальные примеры, инструменты которые работают прямо сейчас.