Google I/O 2026: Gemini перестаёт быть чатом и становится агентом
Каждый год Google I/O — это парад демок, которые обычно работают «на сцене, но не в продакшене». В 2026-м ситуация изменилась. Компания показала не просто очередную версию языковой модели, а полноценную платформу для автономных ИИ-агентов. Если коротко: Gemini теперь не просто отвечает на вопросы — он действует.
Project Mariner: от демки к рабочему инструменту
Project Mariner дебютировал год назад как экспериментальное расширение для Chrome, которое могло «видеть» страницу и кликать по кнопкам. В 2026-м это уже самостоятельный продукт. Mariner теперь работает не только в браузере, но и как системный ассистент на Android. Он может открыть приложение каршеринга, найти ближайшую машину, забронировать её и построить маршрут — всё по одной голосовой команде.
Главное отличие от прошлых версий — скорость. Раньше агент «думал» по 5-10 секунд перед каждым действием. Сейчас это почти мгновенно, потому что модель запускается локально на устройстве (Tensor G6) и использует кэшированный контекст. Для предпринимателей это означает, что сценарии вроде «автоматического заполнения 50 заявок на тендер» или «сбора данных с 200 страниц конкурентов» перестают быть фантастикой.
Gemini 3.0: мультимодальность в реальном времени
Gemini 3.0 — не просто обновление, а смена архитектуры. Модель теперь нативно обрабатывает видео, аудио и текст в одном потоке, без промежуточной конвертации. На практике это выглядит так: пользователь показывает камере смартфона неисправный узел на станке, а Gemini в реальном времени распознаёт детали, читает инструкцию с экрана ноутбука и голосом объясняет порядок действий, подсвечивая элементы на видео.
Для разработчиков ключевое изменение — новый API StreamingMultimodal, который позволяет передавать данные в реальном времени без задержек. Раньше мультимодальные модели работали в режиме «загрузил картинку — получил ответ». Теперь это поток: камера → модель → действие → обратная связь за миллисекунды.
Открытый API для агентов: каждый может собрать своего помощника
Самая важная новость для предпринимателей и разработчиков — Google открывает Agent API. Это фреймворк для создания автономных агентов, которые могут выполнять цепочки действий: авторизоваться на сайте, заполнять формы, отправлять запросы в CRM, генерировать отчёты и отправлять их в Telegram.
API включает три ключевых компонента:
- Planner — разбивает сложную задачу на шаги.
- Executor — выполняет шаги, вызывая внешние сервисы через REST или GraphQL.
- Memory — хранит контекст сессии и историю, чтобы агент не «забывал», что делал 10 минут назад.
Для малого бизнеса это означает, что можно автоматизировать поддержку клиентов без привлечения команды разработки: агент сам отвечает в чате, проверяет статус заказа, перенаправляет сложные вопросы людям.
Что это значит для предпринимателей
Тренд на «агентный ИИ» перестал быть хайпом. Если раньше автоматизация требовала написания скриптов и интеграций, то теперь достаточно описать задачу на естественном языке — Gemini сам решит, как её выполнить.
Плюсы очевидны: снижение операционных расходов, скорость обработки запросов, возможность масштабировать поддержку без найма. Минусы тоже есть: агенту нужен доступ к данным и аккаунтам, а значит — вопросы безопасности. Google обещает, что все действия логируются и пользователь может отменить любое действие вручную.
Стоит ли внедрять прямо сейчас
Если бизнес связан с рутинными операциями — обработка заявок, бронирование, сбор данных, ответы на типовые вопросы — то да. Google уже предоставил бесплатный доступ к Agent API в рамках trial-аккаунта для разработчиков. Ограничение одно: агент не может совершать финансовые транзакции без подтверждения пользователя. Всё остальное — автоматизируемо.
Главный риск — модель всё ещё может ошибаться в нестандартных сценариях. Поэтому на старте стоит внедрять агентов с человеческим контролем (human-in-the-loop), а не на полном автопилоте. Но вектор понятен: через год-два «агент» станет таким же привычным инструментом, как CRM или корпоративный мессенджер.