Коллекция V2: теперь у ваших персонажей может быть любой мир.
И диалоги
 
В первой версии коллекции у каждого аватара был набор устойчивых движений на фиксированном фоне. Идея была простой: “вот типаж + его жесты, которые можно переозвучить и адаптировать под задачу”. У каждого — своя галерея жестов, от 10 до 25 разных motion’ов.​
1. Любой фон для знакомого жеста

Мир, как оказалось, умеет удивлять. Такие инструменты, как Kling O1, внезапно научились нормально справляться с задачей замены фона в видео. Вместо того чтобы “удалять фон” и ломать картинку, теперь можно использовать исходное видео как источник движения, а фон собирать заново, сохраняя пластику и характер жеста.​​
И теперь для моего заказчика можно генерировать видео с аватарами с (почти) любыми фонами — на тех же самых жестах.

IRA. Collection V2
Deimos&Khalia. Collection V2
2. Диалоги: светлый и тёмный в одной сцене

Вопрос 1. Повлияет ли это на характер аватара?
Думаю, что нет. Во всяком случае, мне бы очень не хотелось разрушать концепцию типажей (светлые, тёмные, джокеры), чтобы выбор персонажа оставался привычным и понятным:
“мне нужно облить зрителя презрением — значит, беру Арчи;
если нужно вежливо поржать над зрителем — беру Иру…”
и так далее. Логика выбора остаётся прежней, просто сцена вокруг них теперь может меняться.​

Собственно, принципы выбора уже были описаны в предыдущих текстах, и они не изменились.

Вопрос 2. Повлияет ли это на цену за видео с аватаром?
Тоже вряд ли. Если галерея жестов — это всего лишь витрина (и она не конечна), а я и так проектирую жесты под конкретного заказчика, то почему бы не спроектировать и фон? Это такая же работа под задачу. Для каждого — своя.​
Поэтому я не могу дать чёткий пошаговый план “как мы работаем”: слишком много нюансов.
Конечно, мне было бы проще сделать для вас видео с персонажем “как мне придумается”, опираясь только на ваше описание. Но будете ли вы довольны моими придумками — большой вопрос. Поэтому мы обычно разговариваем. Долго. И поэтому прайс на сайте — не мёртвый фикс (надо же!), а вариант для обсуждения.
3. Синхронизация двух аватаров в одном кадре

Развивающийся ИИ-инструментарий подкинул ещё один приятный сюрприз: можно совмещать в одном кадре двух персонажей и липсинковать их как диалог.​​

Это значит, что заказчик, как я и писал раньше, действительно может микшировать персонажей, а не останавливаться на одном выбранном варианте.

Например: условный тёмный и светлый аватар на одном фоне, разговаривают между собой, а не просто по очереди выскакивают в кадр.

Вопросы про характер персонажа и стоимость, думаю, здесь те же. Я не возьмусь сказать, где трудозатрат больше: в “обычных” видео с выбранными жестами или в версии №2 коллекции, в “v2 — backgrounds & dialogues”.
Zakhra&Archi. Collection V2
И там, и там всё упирается в разговор с заказчиком и объём работы. Увы (или к счастью), я не обувная фабрика, где делают одинаковые сапоги в 100 моделях и 300 цветах. Я просто делаю красивое на заказ.
4. Реалистичные ожидания: магия требует проверки
Даже при новом подходе важно учитывать реальность инструментов:
  • замена фона через разные видеосервисы даёт неплохой результат в большинстве случаев, но при сложном освещении или активных движениях где‑нибудь обязательно вылезет артефакт — шум, “ползущие” границы, изменения цвета;​
  • сцены с двумя и особенно тремя персонажами нужно тестировать: не каждый жест одинаково хорошо переносится в многофигурную композицию;​
  • multi‑lip‑sync тоже не идеален: иногда губы и звук живут с лёгким сдвигом, и это приходится отсматривать и при необходимости перегенерировать.​
Поэтому “Коллекция аватаров V2” — это не про “идеальную магию”, а про честное расширение возможностей. Новые режимы есть, но каждый конкретный ролик остаётся результатом аккуратного подбора жеста, фона и инструмента под задачу. И тестирования.
...какую‑то часть пути мы уже проходили, а значит...
5. Итог: система сцен вместо “кусочков видео”

В итоге то, что раньше было “коллекцией отдельных аватаров”, постепенно превращается в систему сцен: персонажи остаются прежними, но мир вокруг них становится подвижным.​

Так что с новыми заказчиками я приглашаю и прежних: какую‑то часть пути мы уже проходили, а значит следующие шаги будут проще, быстрее, понятнее и… часто дешевле.
Made on
Tilda