Перейти к содержанию

Google I/O 2026: Gemini перестаёт быть чатом и становится агентом

Каждый год Google I/O — это парад демок, которые обычно работают «на сцене, но не в продакшене». В 2026-м ситуация изменилась. Компания показала не просто очередную версию языковой модели, а полноценн...

Google I/O 2026: Gemini перестаёт быть чатом и становится агентом

Каждый год Google I/O — это парад демок, которые обычно работают «на сцене, но не в продакшене». В 2026-м ситуация изменилась. Компания показала не просто очередную версию языковой модели, а полноценную платформу для автономных ИИ-агентов. Если коротко: Gemini теперь не просто отвечает на вопросы — он действует.

Project Mariner: от демки к рабочему инструменту

Project Mariner дебютировал год назад как экспериментальное расширение для Chrome, которое могло «видеть» страницу и кликать по кнопкам. В 2026-м это уже самостоятельный продукт. Mariner теперь работает не только в браузере, но и как системный ассистент на Android. Он может открыть приложение каршеринга, найти ближайшую машину, забронировать её и построить маршрут — всё по одной голосовой команде.

Главное отличие от прошлых версий — скорость. Раньше агент «думал» по 5-10 секунд перед каждым действием. Сейчас это почти мгновенно, потому что модель запускается локально на устройстве (Tensor G6) и использует кэшированный контекст. Для предпринимателей это означает, что сценарии вроде «автоматического заполнения 50 заявок на тендер» или «сбора данных с 200 страниц конкурентов» перестают быть фантастикой.

Gemini 3.0: мультимодальность в реальном времени

Gemini 3.0 — не просто обновление, а смена архитектуры. Модель теперь нативно обрабатывает видео, аудио и текст в одном потоке, без промежуточной конвертации. На практике это выглядит так: пользователь показывает камере смартфона неисправный узел на станке, а Gemini в реальном времени распознаёт детали, читает инструкцию с экрана ноутбука и голосом объясняет порядок действий, подсвечивая элементы на видео.

Для разработчиков ключевое изменение — новый API StreamingMultimodal, который позволяет передавать данные в реальном времени без задержек. Раньше мультимодальные модели работали в режиме «загрузил картинку — получил ответ». Теперь это поток: камера → модель → действие → обратная связь за миллисекунды.

Открытый API для агентов: каждый может собрать своего помощника

Самая важная новость для предпринимателей и разработчиков — Google открывает Agent API. Это фреймворк для создания автономных агентов, которые могут выполнять цепочки действий: авторизоваться на сайте, заполнять формы, отправлять запросы в CRM, генерировать отчёты и отправлять их в Telegram.

API включает три ключевых компонента:

  • Planner — разбивает сложную задачу на шаги.
  • Executor — выполняет шаги, вызывая внешние сервисы через REST или GraphQL.
  • Memory — хранит контекст сессии и историю, чтобы агент не «забывал», что делал 10 минут назад.

Для малого бизнеса это означает, что можно автоматизировать поддержку клиентов без привлечения команды разработки: агент сам отвечает в чате, проверяет статус заказа, перенаправляет сложные вопросы людям.

Что это значит для предпринимателей

Тренд на «агентный ИИ» перестал быть хайпом. Если раньше автоматизация требовала написания скриптов и интеграций, то теперь достаточно описать задачу на естественном языке — Gemini сам решит, как её выполнить.

Плюсы очевидны: снижение операционных расходов, скорость обработки запросов, возможность масштабировать поддержку без найма. Минусы тоже есть: агенту нужен доступ к данным и аккаунтам, а значит — вопросы безопасности. Google обещает, что все действия логируются и пользователь может отменить любое действие вручную.

Стоит ли внедрять прямо сейчас

Если бизнес связан с рутинными операциями — обработка заявок, бронирование, сбор данных, ответы на типовые вопросы — то да. Google уже предоставил бесплатный доступ к Agent API в рамках trial-аккаунта для разработчиков. Ограничение одно: агент не может совершать финансовые транзакции без подтверждения пользователя. Всё остальное — автоматизируемо.

Главный риск — модель всё ещё может ошибаться в нестандартных сценариях. Поэтому на старте стоит внедрять агентов с человеческим контролем (human-in-the-loop), а не на полном автопилоте. Но вектор понятен: через год-два «агент» станет таким же привычным инструментом, как CRM или корпоративный мессенджер.

Читайте также