У вас видеостудия или контент-отдел - каждый новый ролик требует кастинга, съёмок, монтажа. Заказчик просит: «Сделайте того же человека, но в другом интерьере». Вы переснимаете. Или тратите часы на поиск похожего актёра. А если нужно 20 сцен с одним персонажем - это неделя работы.
Runway Gen-4.5 решает это за вечер. Загружаете одну фотку - модель генерирует десятки клипов, где персонаж выглядит одинаково. Плюс правит готовое видео текстом и переносит движения из любого ролика. Без программиста, без студии.
Разберём на примере видеопродакшна. Допустим, вы делаете рекламные ролики для стройфирмы. Нужно 10 сцен с одним прорабом: на объекте, в офисе, с клиентом. Вместо съёмок - одна фотка прораба и 10 промптов. Runway выдаёт 10 клипов с одним и тем же лицом. Это пример, не реальный кейс автора.
Что изменилось: Gen-4 (март 2025) -> Gen-4 Turbo (апрель 2025) -> Gen-4.5 (декабрь 2025)
Runway обновлялась быстро - почти каждые два месяца. Вот что важно для бизнеса:
Gen-4 (март 2025): Первая версия, где character consistency заработала нормально. Клипы до 16 секунд. Стал лидером по физике и движению.
Gen-4 Turbo (апрель 2025): Та же модель, но в 5 раз быстрее и дешевле в 2 раза. Качество чуть хуже - для черновиков.
Gen-4.5 (декабрь 2025): Главное для бизнеса:
- Клипы до 60 секунд (было 16).
- 4K разрешение.
- Нативное аудио - диалоги, звуки прямо из промпта.
- Понимает многосценные инструкции - можно описать целую последовательность планов одним запросом.
Сейчас Gen-4.5 - лидер публичных тестов по качеству видео. Gen-4 Turbo остаётся как дешёвая опция для черновиков.
Character consistency: как получить одинакового персонажа в десятках клипов
Это главная фишка для бизнеса. Больше не нужно искать одного и того же актёра на все съёмки.
Как сделать за 15 минут:
Подготовьте фото персонажа. Фронтальный план или 3/4, нейтральный фон, хорошее освещение. Можно 1-3 фото.
Загрузите в Runway. Создаёте Character Profile - именованный профиль с фотографиями. Хранится в проекте.
Пишете промпт с тегом персонажа. Например: «[Character: Maya] walks into a sunlit room, looking around with curiosity. Dolly in, shallow depth of field.»
Получаете клип. Runway вставляет персонажа Майя (из загруженного фото) в сцену. Внешность сохраняется при смене освещения, угла камеры, одежды.
Почему это лучше конкурентов: Gen-4.5 использует несколько фото для построения полного образа. Одна фотка даёт базовую стабильность. Три - заметно лучше при экстремальных углах и крупных планах.
Практический тест: Gen-4.5 держал узнаваемость персонажа через 20+ клипов с разным освещением. Конкуренты начинали «плыть» после 5-8 клипов.
Ограничения:
- Не работает с фото реальных людей без их согласия - Runway проверяет.
- Анимированные персонажи и иллюстрации дают менее точный результат.
- При сильной смене стиля освещения (дневной -> ночной) consistency снижается.
Gen-4.5: нативное аудио, multi-shot sequencing, клипы до 60 секунд в 4K
Нативное аудио: Runway генерирует диалоги и звуки прямо из промпта. Реплика в кавычках - диалог, описание действия - звук. Пример: «A detective enters a dimly lit interrogation room. He sets a folder on the metal table with a sharp clang. He says: "We know what happened that night." Fluorescent light flicker, distant office noise, subtle tension.»
Качество диалога - на уровне конкурентов. Для русского языка пока хуже английского.
Multi-shot sequencing: Можно описать целую последовательность планов в одном промпте. Синтаксис: «SHOT 1:», «CUT TO:», «SMASH CUT:». В 60-секундный клип помещается 3-6 планов.
Клипы до 60 секунд: Это самый длинный базовый клип среди конкурентов. Sora 2 - 25 секунд, Kling 2.1 - 30 секунд, Veo 3.1 - 12 секунд. 60 секунд - полноценный нарративный фрагмент без склейки.
Важно: качество temporal consistency (стабильность деталей во времени) снижается с длиной. Для идеального результата лучше генерировать 15-20 секунд и монтировать.
4K разрешение: Доступно на планах Pro и выше. Генерация 4K в 2-3 раза дольше и дороже 1080p. Для соцсетей и презентаций 1080p достаточно. 4K оправдан для больших экранов или постобработки с кропами.
Aleph (июль 2025): редактирование готового видео текстом без перегенерации
Aleph - отдельная модель для правки уже готового видео. Главная ценность: не нужно регенерировать клип с нуля при мелких правках.
Что умеет Aleph:
- Заменить объект: «Замени красный автомобиль на синий» - цвет меняется, движение и тени сохраняются.
- Удалить объект: «Убери логотип со стены» - объект исчезает, фон заполняется.
- Добавить элемент: «Добавь падающий снег» - снег вписывается в освещение и физику.
- Изменить атмосферу: «Сделай сцену ночной» - адаптируются освещение и тени.
- Изменить одежду персонажа: «Персонаж в чёрном пальто вместо серого» - с сохранением движений и внешности.
Как это работает технически: Aleph использует video-conditioned inpainting - модель «видит» оригинальное видео и генерирует изменение как наложение, сохраняя движение, камеру и физику. Это не маска поверх видео, а реальная регенерация целевой области.
Ограничения:
- Структурные изменения (переставить мебель) работают хуже точечных (заменить объект).
- Сложные изменения с множеством объектов требуют нескольких итераций.
- Aleph не «понимает» нарратив - он редактирует клип, а не историю.
Стоимость: Aleph-редактирование дешевле полной регенерации. Примерно $0.01-0.05 за секунду видео в зависимости от сложности.
Act-Two (июль 2025): перенос движений из любого видео без специального оборудования
Раньше для переноса движений нужна была mocap-студия с маркерами и дорогим оборудованием. Act-Two делает это из обычного видео.
Что делает Act-Two: Загружаете обычное видео человека (съёмка на телефон, YouTube-ролик). Act-Two извлекает паттерн движения тела - каждый сустав, каждый жест. Затем применяет этот паттерн к AI-сгенерированному персонажу или другому видео.
Практические применения для бизнеса:
- Анимация персонажей: Снимаете себя танцующим на телефон. Act-Two переносит движения на мультипликационного персонажа или AI-аватара. Без студии.
- Смена персонажа: Берёте публичное видео танцора. Переносите движения на своего персонажа. Персонаж двигается как оригинал, но выглядит по-другому.
- Анимация иллюстраций: Reference image персонажа + движение из source video = анимированный персонаж с характерной пластикой.
Требования к source video:
- Хорошо видимый контур тела, без сильного перекрытия.
- Чёткость достаточная для отслеживания суставов.
- Студийная съёмка улучшает точность, но телефон работает.
- Видео из интернета работает технически, но нужно проверять авторские права на движения (юридически серая зона).
Качество результата: Act-Two хорошо работает с ритмичными движениями (танец, ходьба, спорт). Сложные мелкие движения рук или пальцев - с меньшей точностью. Лицевая анимация не передаётся - только тело.
Motion Brush 3.0: рисование векторов движения по зонам кадра
Motion Brush - инструмент для image-to-video, где вместо текстового описания движения рисуете векторы прямо на изображении.
Как работает:
- Загружаете статичное изображение.
- Инструментом Motion Brush рисуете стрелки на объектах, которые должны двигаться.
- Настраиваете скорость (1-10) и силу движения для каждой зоны.
- Запускаете генерацию.
Motion Brush 3.0 (декабрь 2025) vs предыдущих версий:
- Точность интерпретации векторов выросла.
- Добавлен контроль скорости по временной шкале - можно задать ускорение или замедление.
- Поддержка нескольких независимых зон с разными движениями в одном кадре.
- Layer-based интерфейс: разные объекты на разных слоях с независимым контролем.
Когда Motion Brush лучше текстового промпта:
- Нужно точно контролировать направление и скорость конкретного элемента.
- Несколько объектов в кадре двигаются по-разному.
- Image-to-video с нестандартной физикой (флаг в ветру с конкретным направлением, вода текущая влево).
Gen-4 Turbo vs Gen-4.5: скорость x5 vs максимальное качество - что выбрать
| Параметр | Gen-4 Turbo | Gen-4.5 |
|---|---|---|
| Скорость | ~30 сек на 10-сек клип | ~3-5 мин на 10-сек клип |
| Качество | 85% от Gen-4.5 | Максимальное |
| Цена за 10 сек | $0.25 | $0.50 (1080p), $1.00 (4K) |
| Макс. длина | 16 секунд | 60 секунд |
| Нативное аудио | Нет | Да |
| 4K | Нет | Да |
Gen-4 Turbo используйте когда:
- Тестируете промпты и ищете нужную сцену - быстро, дёшево.
- Нужно много контента за короткое время.
- Качество «очень хорошее» достаточно - финальная публикация в соцсетях.
- Нет бюджета на Gen-4.5 для всего проекта.
Gen-4.5 используйте когда:
- Финальный клиентский материал - реклама, корпоративный контент.
- Нужна длина больше 16 секунд.
- Нативное аудио важно для проекта.
- Character consistency критична для нарратива с несколькими сценами.
Runway API в Python: генерация клипа, Aleph-правки, polling и экспорт
Если у вас есть менеджер, который умеет запускать Python-скрипты, вот код для генерации и правки. Если нет - можно делать всё через веб-интерфейс Runway, это не сложнее работы в фотошопе.
Следующий код запускает генерацию клипа через Runway API, ожидает завершения задачи и скачивает результат.
import runwayml
import time
import requests
from pathlib import Path
# Инициализация клиента
client = runwayml.RunwayML(api_key="your_runway_api_key")
def generate_clip(
prompt: str,
model: str = "gen4_5", # или "gen4_turbo"
duration: int = 10,
resolution: str = "1080p", # или "2160p" (4K)
reference_image_path: str = None
):
"""
Генерирует видеоклип через Runway API.
"""
params = {
"promptText": prompt,
"model": model,
"duration": duration,
"resolution": resolution,
"ratio": "16:9"
}
# Добавляем reference image если нужен character consistency
if reference_image_path:
with open(reference_image_path, 'rb') as f:
img_data = f.read()
# Загружаем image на Runway
asset = client.assets.create(
data=img_data,
content_type="image/jpeg"
)
params["referenceImageId"] = asset.id
task = client.image_to_video.create(**params)
return task.id
def poll_task(task_id: str, max_wait: int = 600):
"""
Ждёт завершения задачи и возвращает URL видео.
"""
start = time.time()
while time.time() - start < max_wait:
task = client.tasks.retrieve(task_id)
print(f"Status: {task.status}")
if task.status == "SUCCEEDED":
return task.output[0] # URL видео
elif task.status == "FAILED":
raise Exception(f"Task failed: {task.failure}")
time.sleep(15)
raise TimeoutError("Task timed out")
def apply_aleph_edit(
video_url: str,
edit_prompt: str
):
"""
Применяет Aleph-редактирование к существующему клипу.
"""
task = client.videos.edit(
video_url=video_url,
edit_prompt=edit_prompt,
model="aleph"
)
return poll_task(task.id)
def download_video(url: str, output_path: str):
response = requests.get(url, stream=True)
with open(output_path, 'wb') as f:
for chunk in response.iter_content(chunk_size=8192):
f.write(chunk)
print(f"Saved: {output_path}")
# Пример: генерация + Aleph правка
# Шаг 1: Генерируем клип с character reference
task_id = generate_clip(
prompt="[Character: Maya] sits at a cafe table, sunlight through window. She opens a notebook. Slow dolly in. Soft ambient cafe noise. Warm afternoon light.",
model="gen4_5",
duration=15,
reference_image_path="maya_reference.jpg"
)
video_url = poll_task(task_id)
print(f"Generated: {video_url}")
# Шаг 2: Правим через Aleph - меняем цвет notebook
edited_url = apply_aleph_edit(
video_url=video_url,
edit_prompt="Change the notebook to dark blue leather cover"
)
download_video(edited_url, "maya_cafe_edited.mp4")
Практический совет: Runway API имеет лимиты на количество запросов - особенно для Gen-4.5. При пакетной генерации добавьте exponential backoff при получении 429 ошибок.
Частые вопросы
Gen-4.5 реально обогнал Veo 3.1 в тестах - это маркетинг или подтверждённый факт?
В независимых тестах начала 2026 года Gen-4.5 держит первое-второе место по качеству движения и стабильности персонажа. Veo 3.1 лучше по нативному аудио и стоимости. Это не чистый маркетинг. Но «лучший» зависит от задачи: для нарративных клипов с персонажами - Runway. Для контента с нативным аудио дёшево - Veo.
Aleph умеет удалять объекты из видео или только заменять их?
Оба варианта. Удаление объекта с заполнением фона работает через промпт «Remove the [object] from the scene». Aleph заполняет пространство контекстно. Качество удаления зависит от сложности фона: однородный фон (стена, небо) - хорошо. Детальный фон с текстурами или движущимися элементами - возможны артефакты.
Act-Two требует специальной съёмки или работает с любым видео из интернета?
Технически работает с любым видео, где хорошо виден контур тела. Студийная съёмка даёт более точный tracking суставов. Телефон в хорошем освещении - достаточно для большинства задач. Видео из интернета технически работает. Юридически: перенос движений публичных деятелей в коммерческий контент - серая зона. Terms of Service Runway запрещают создание контента, нарушающего права третьих лиц.
Как передать reference-изображение в Runway API через Python?
Смотрите пример выше: изображение сначала загружается как asset через client.assets.create(), затем ID asset добавляется в параметр referenceImageId запроса на генерацию. Альтернативный способ: передать URL публично доступного изображения напрямую в поле referenceImageUrl без предварительной загрузки.
Runway Gen-4.5 vs Kling 2.1 Master - что дешевле за минуту итогового видео?
Kling 2.1 Master через прямой тариф Pro: около $2.10 за минуту. Runway Gen-4.5 1080p: около $3.00 за минуту. Runway Gen-4.5 4K: около $6.00 за минуту. Kling дешевле при прямом сравнении. Но если учитывать character consistency (меньше итераций), Aleph-правки (дешевле полной регенерации) и длину клипа 60 секунд (меньше монтажной работы), реальная стоимость боевая среда-пайплайна на Runway для сложных проектов может быть ниже.
Что делать прямо сейчас
- Зайдите на runwayml.com, зарегистрируйтесь.
- Возьмите бесплатный план (даёт немного кредитов на пробу).
- Загрузите фото персонажа и напишите первый промпт с тегом [Character: Имя].
- Посмотрите результат. Если понравится - переходите на платный план от $15/мес.
Не пытайтесь освоить всё сразу. Начните с character consistency - это даёт наибольший эффект для бизнеса.
AI Компас (t.me/kosmoslab_ai) - канал для предпринимателей в РФ и СНГ, которые применяют AI в своём бизнесе без программиста. Разбираем инструменты и схемы - без курсов и теории.