Воркшоп · 30.06.2026 · Dmytro Kniazkov

ИИ делает музыку, фото и видео

Suno для звука, ChatGPT / Gemini / Nano Banana Pro для фото, Kling и Seedance для видео — а Claude пишет промты и придумывает идеи. Higgsfield собирает всё это в одном окне. Сервисы, методы и приёмы из практики.

≈2¢ за трек Nano Banana Pro фото Seedance · 4K видео 3 медиа
01

Музыка

Suno + связка с ИИ-ассистентами
Инструментарий

Сервисы для музыки

По роли: чем генерируем звук, чем пишем идеи и тексты, и какие помощники ускоряют процесс. Для каждого — что это и как пользоваться.

A

Генерация музыки

генератор

Suno

81 млн визитов/мес · API нет
Что это
Главный генератор музыки в нише. Пишет вокал, инструментал и целые треки по текстовому описанию.
Как пользоваться
Вкладка Create. Заполняете два поля — Lyrics (текст) и Styles (стиль) — и жмёте Create.
конкурент

Udio

1,7 млн визитов/мес
Что это
Прямой конкурент Suno, вышел примерно тогда же. Пока заметно уступает и по трафику, и по качеству.
Как пользоваться
Логика та же: стиль + текст. В воркшопе показан для сравнения, как основной не используется.
B

Идеи, тексты и стили

лучший

Claude

Opus 4.8 · режим High
Что это
ИИ-ассистент. По тестам автора даёт лучшие тексты и стили для Suno из всех моделей.
Как пользоваться
«Создай для Suno хит — текст и стиль, 4 варианта». Копируете Lyrics и Styles в Suno. Можно попросить раскритиковать и переписать.
альтернатива

ChatGPT

версия 5.5
Что это
ИИ-ассистент от OpenAI. Тоже пишет промты и хорошо заполняет лимит поля стиля.
Как пользоваться
Тот же запрос, что и к Claude. Удобно, когда нужно сравнить формулировки от разных моделей.
альтернатива

Gemini

генерация идей
Что это
ИИ-ассистент от Google. Третий вариант для идей и промтов.
Как пользоваться
Скидываете идею — получаете текст и стиль. В сравнении уступил Claude, но полезен как запасной.
C

Помощники и источники

конструктор

Google AI Studio

мини-приложения
Что это
Среда Google, где за минуты собирается маленькое приложение под свою задачу.
Как пользоваться
Автор собрал в ней генератор идей. Готовый промт переносится в Claude, а оттуда — в Suno.
своё

Suno Spark

самодельное приложение
Что это
Генератор «цепляющих музыкальных идей в одну кнопку», собранный в AI Studio.
Как пользоваться
Выбираете язык, настроение и «градус безумия» → получаете идею → отдаёте её в Claude.
транскрипт

TurboScribe

аудио → текст
Что это
Сервис транскрибации: превращает аудио или видео по ссылке в текст.
Как пользоваться
Вставляете ссылку с YouTube, выбираете язык аудио — получаете текст трека как референс.
аналитика

Similar Web

трафик сайтов
Что это
Аналитика посещаемости. Помогает оценить, насколько сервис популярен.
Как пользоваться
Вводите домен — видите визиты. Так автор сравнил Suno (81 млн) и Udio (1,7 млн).
референсы

YouTube

источник вайба
Что это
Банк референсов. Любой понравившийся трек можно взять за основу настроения.
Как пользоваться
Ссылка на трек → в TurboScribe → текст и стиль → в Suno.
Пайплайн

Три способа собрать трек

Все три ведут в Suno, но заходят с разных сторон: от готового запроса, от сгенерированной идеи или от чужого трека-референса.

01

Через Claude

базовый · быстрый
  1. В Claude пишете простой запрос: «создай для Suno хит — текст и стиль, много просмотров и высокое удержание, 4 варианта».
  2. Claude выдаёт готовые Lyrics и Styles на каждый из четырёх треков.
  3. Копируете Styles → вставляете в поле Styles в Suno.
  4. Копируете Lyrics → вставляете в поле Lyrics.
  5. Жмёте Create. Через ~30 секунд слушаете результат.
Совет. Попросите Claude раскритиковать свой текст и переписать — выходит заметно сильнее.
02

Через AI Studio

когда нет идеи
  1. В «Suno Spark» выбираете язык, настроение и «градус безумия».
  2. Одним нажатием получаете цепляющую идею для песни.
  3. Переносите идею в Claude — он превращает её в чистый текст и стиль.
  4. Дальше как в первом методе: Lyrics и Styles в Suno.
  5. Create — и слушаете варианты.
Зачем. Помогает «завестись», когда своей идеи ещё нет.
03

Референс с YouTube

самый оригинальный
  1. Находите на YouTube трек, вайб которого нравится.
  2. Ссылку — в TurboScribe, выбираете язык аудио, транскрибируете.
  3. Получаете текст и приблизительный стиль этого трека.
  4. По желанию начитываете свой текст голосом или редактируете.
  5. Отдаёте в Suno — получаете похожий по настроению трек.
Пример. Так автор сделал трек про Змея Горыныча — оперный «хит» с симфонией.
Экономика и приёмы

Цифры и лайфхаки Suno

Почему это дёшево, что доступно бесплатно и приёмы, которые отличают «типичную нейросеть» от трека, который не угадывается.

за трек при пакете на 500 песен
30с
примерная скорость генерации
5:1
примерно каждый пятый трек — по-настоящему интересный
1000
символов в поле Styles — заполняйте целиком
Лайфхаки автора

MIDI вместо оригинала: тексты и мелодии артистов блокируются авторским правом, но MIDI-версии (Mortal Kombat, Mario, «Пираты Карибского моря») — не оригинальная запись, их можно свободно пересобрать (например, тему Mortal Kombat в симфонию). Эффекты для живости: ремарки прямо в тексте (шёпот, «хруст нарезки хлеба») делают трек живее и хуже угадываемым. Солирующие инструменты: если явно прописать инструменты, Suno вытягивает выразительные соло. Свой голос уже можно загрузить (платно), но звучит пока лишь отдалённо похоже.

02

Фото

ChatGPT · Gemini · Nano Banana Pro · Higgsfield
Инструментарий

Сервисы и модели для фото

Принцип тот же, что с музыкой: даёте нейросети своё фото как референс и промт, а разные модели дают разный результат. В воркшопе сравнивали ChatGPT, Gemini и Nano Banana Pro.

обложки

ChatGPT

платно 5 фото · free 2
Что это
В платной версии (пятёрка) создаёт изображения — например, обложки для YouTube с высоким CTR.
Как пользоваться
Прикрепляете своё фото как референс и пишете промт («сделай меня в разных профессиях, текст придумай сам, хайповый»). На бесплатке — 2 фото.
со стилем

Gemini

Pro · выбор стиля
Что это
Генерирует изображения, можно выбрать стиль или обойтись без него.
Как пользоваться
Закидываете фото-референс и промт. У автора «плейн» Gemini вышел слабее, но кому-то Gemini даёт результат лучше, чем ChatGPT — модель подбирают под себя.
топ

Nano Banana Pro

узнаёт лицо · «прошечка»
Что это
Топовая модель (доступна в Gemini и в Higgsfield). Аккуратно делает текст и узнаёт лицо по референсу.
Как пользоваться
Даёте референс — получаете качественный кадр, который можно сразу пускать в видео. Дизайнеры активно делают на ней визуалы (например, интерьеры).
платформа

Higgsfield

все модели · платно
Что это
Сервис, где можно тестировать все модели — фото, видео и аудио в одном окне.
Как пользоваться
Идёт сразу с платной версией. Закидываете референс, выбираете модель, получаете несколько вариантов. 4 изображения ≈ 8 кредитов.
Пайплайн

Как делать фото

Три захода: подобрать модель под референс, взять промт у ChatGPT или собрать идеи через Claude.

01

Модель и референс

основа
  1. Открываете чат и выбираете «создать изображение».
  2. Прикрепляете своё фото как референс — доп. информацию для нейросети.
  3. Берёте топовую модель: Nano Banana Pro или ChatGPT.
Смысл. Результат зависит от промта и референса.
02

Промт через ИИ

как с музыкой
  1. Просите ChatGPT написать промт (например, под Gemini).
  2. Просите на английском — так модель понимает точнее.
  3. Вставляете промт и генерируете.
Совет. Готовые промты можно искать в поиске — их миллионы, останется чуть отредактировать.
03

Идеи через Claude

чтобы «зашло»
  1. Просите Claude 10 оригинальных идей для фотосессии.
  2. Условие: чтобы набирали просмотры и были в топе в Instagram / Facebook.
  3. Прорабатываете идеи и выбираете, что зайдёт.
Плюс. ИИ придумает то, до чего сам не додумаешься.
Ключевой нюанс

Под каждое фото — новый чат. Если делать новый промт для фотографии в старом чате, картинки начинают «сбиваться». Это отдельный момент, который замечает каждый, кто работает с генерацией: открывайте чистый чат под каждую задачу.

Цифры и приёмы

Что стоит запомнить по фото

Немного цифр из демонстрации и приёмы, которые повторяли на воркшопе.

5 / 2
фото за раз: платный и бесплатный ChatGPT
×4
варианта параллельно в Higgsfield
8 кр
за эти 4 изображения в Higgsfield
EN
промт для фото лучше писать на английском
03

Видео

Higgsfield · Kling 3.0 · Seedance · Cinema Studio
Инструментарий

Сервисы и модели для видео

Через Higgsfield доступны разные видео-модели и собственные инструменты. Промт для видео удобно диктовать голосом и расписывать через ChatGPT.

платформа

Higgsfield

фото · видео · аудио
Что это
Одно окно к видео-моделям плюс собственные инструменты. Идёт с платной версией.
Как пользоваться
Переносите промт, выбираете модель и качество (до 4K), генерируете.
база

Kling 3.0

«неплохо, но видно ИИ»
Что это
Рабочая видео-модель. Понятно, но местами заметно, что генерация — ИИ.
Как пользоваться
Годится для проб; для продакшена автор берёт модель посерьёзнее.
стандарт

Seedance 2

4K · для продакшена
Что это
На данный момент — стандарт индустрии видео. Быстрые, резкие смены сцен, впечатляющее качество.
Как пользоваться
Основной выбор для профессионала. Есть Seedance Fast (упрощённый, дешевле). Скоро выйдет 2.5.
casual

Gemini (видео)

~$20/мес · 2 видео/день
Что это
Вариант «побаловаться»: по подписке ~$20/мес — 2 видео в день, около 60 в месяц, по 10 секунд.
Как пользоваться
Для несложных задач. Для профессионального результата — Seedance.
сборка

Cinema Studio 3.5

тегируешь фото через @
Что это
Видеоредактор в Higgsfield: собираете ролик из нескольких своих фото.
Как пользоваться
Значком @ («собачкой») тегируете фото как элементы и строите историю (например, мультик из 5 фото кота). Платно, каждое фото проходит проверку на авторские права.
агент

Суперкомпьютер

агент Higgsfield
Что это
Новая агентная система в Higgsfield: понимает изображение, видео и текст и сама генерит — заменяет ручную связку с Claude.
Как пользоваться
Общаетесь как с Claude (просит референс, задаёт вопросы, на английском). Внутри — модели вроде Claude Opus 4.8 и Gemini, часть бесплатна (Gemini 3.5 Flash).
реклама

UGC / маркетинг

продукт → ролик
Что это
Инструмент под маркетинг: вставляете фото продукта (напиток, сумка, чемодан) и описываете, что нужно.
Как пользоваться
Генерирует рекламный ролик с продуктом. Пока срабатывает не всегда и заметно, что ИИ, но технология быстро развивается.
Пайплайн

Как делать видео

Наговорить идею голосом, дать ChatGPT расписать её по секундам, выбрать модель — и при желании собрать историю из своих фото.

01

Промт голосом

через ChatGPT
  1. Наговариваете идею в микрофон: «сделай промт для Higgsfield на 7 секунд, [сюжет]».
  2. ChatGPT выдаёт большой промт по секундам: камера, свет, качество, негатив-промт.
  3. Копируете промт в Higgsfield.
Пример. Персонаж летит на пчеле, 7 форматов за 7 секунд (бумага, реализм, аниме…).
02

Модель и качество

под задачу
  1. Выбираете модель: Kling для проб, Seedance для продакшена.
  2. Ставите качество: 4K доступно, но тяжёлое; для мобильного трафика хватает 720p.
  3. Генерируете; часть дублей не выйдет — это норма.
Масштаб. На один клип обычно уходит около 10 видео.
03

Сборка из фото

Cinema Studio
  1. Тегируете свои фото через @ в Cinema Studio.
  2. Собираете из них историю (например, мультик из 5 фото).
  3. Готовые ролики монтируете в клип.
Пример. Из 5 фото кота выходит мультик о его «походе».
Экономика Higgsfield · по словам автора

Подписки: $19/мес — 300 кредитов (очень мало), средний тариф ~$35, $60/мес — 1200 кредитов (хватает с головой, но дороговато), $90–100/мес — 3000 кредитов. По видео: Seedance 2 ≈ 180 кредитов — около 15 роликов в месяц на 3000 кредитов; Seedance Fast на 720p ≈ 53 кредита — около 60 роликов. При активной генерации 3000 кредитов можно потратить за ~3 дня. Для мобильного трафика берите 720p — вдвое экономнее, чем выше.

Цифры и реальность

Что стоит запомнить по видео

Немного цифр из демонстрации и честный взгляд на то, где ИИ пока проигрывает.

4K
доступно в Seedance (автор ставил 720p из-за нагрузки)
10–15с
длина одного ролика
≈180
кредитов за ролик Seedance 2
≈53
кредита за Seedance Fast на 720p
Где применять

Три медиа в деле

То, что показывали на воркшопе: от поздравительного трека до рекламного ролика с продуктом.

Музыка

Треки и реклама

Поздравительные песни друзьям, музыка без роялти для рекламных роликов (подписка ≈11 €), терапевтические треки «о том, что переживаешь сейчас».

Фото

Обложки и фотосессии

YouTube-обложки с высоким CTR и фотосессии по своему референсу (ChatGPT, Nano Banana Pro). Оригинальные идеи для съёмок — через Claude.

Видео и маркетинг

Ролики и контент

Динамичные клипы на Seedance, мультики из своих фото в Cinema Studio, UGC-реклама продукта и карусели для Instagram и Facebook — шаг к автоматизации контента.