大部分 AI 出的”歌 + 封面”看起来不搭,因为它们是用两份不同的创作 brief 出来的。歌是”忧郁的 indie folk”,封面是”鲜艳的抽象渐变”,听众一进播放页两秒之内就潜意识感觉到了违和。这套流程让 Suno 和 Midjourney 共用一份 brief —— 同一个情绪、同一套色板、同一个年代参考 —— 让歌和封面锁进同一个发行身份。它不是为了画面更漂亮,而是为了让两个工具瞄向同一颗北极星。
本文涵盖
一份共享 brief 驱动两个工具的流程:共同的情绪、色板、年代、人声 / 视觉的质感描述。最后做一次配对测试 —— 听 10 秒歌之后再看封面,还觉得对吗?
关键工具与概念:
- Suno —— 从风格 + 歌词提示词出整首歌的 AI 音乐工具。
- Midjourney —— 本流程里用来生成专辑封面的 AI 图像工具。
- 同一份 brief —— 一份文档,写明共享的情绪、色板、年代、质感词,用来分别推导两个提示词。
这篇适合谁
在 Spotify、Bandcamp、SoundCloud 发行单曲、又不想专门请设计的独立音乐人;要让封面契合节目调性的播客主理人;同时出音频 + 视觉素材的品牌团队。
什么时候用它
单曲发行、EP 和专辑封面、播客封面、配 30 秒音频片段的社媒图、配封面循环视觉的品牌环境音。
开始前
- 写一页 brief,包含:一句话概念、情绪(3 个形容词)、色板(3-4 个颜色)、年代参考(年份 / 年代 / 流派运动)、质感词(颗粒感、丰满、稀疏)、禁用清单(这次发行”不是什么”)。
- 提前定好交付尺寸:Spotify / Apple Music 用 3000×3000,社媒用 1080×1080,Bandcamp 横幅 1500×500。
- 决定封面上要不要有文字。Midjourney 出文字不稳,文字要在剪辑 / 平面软件里另加。
- 把 brief 存成一份可以同时粘到 Suno 和 Midjourney 提示词里的文档。brief 是唯一来源,提示词只是它的派生。
操作步骤
- 写共享 brief:概念 + 情绪 + 色板 + 年代 + 质感 + 禁用清单。控制在 300 字以内。
- 把 brief 翻译成 Suno 风格描述。流派 + 情绪 + 乐器表 + 人声质感 + 制作年代。例如:
indie folk, melancholy, female vocal, acoustic guitar, light piano, intimate room recording, late-90s lo-fi production。 - 把同一份 brief 翻译成 Midjourney 提示词。主体 + 构图 + 色板 + 年代参考 + 质感。例如:
quiet kitchen morning, female figure in window light, beige and dusty rose palette, 90s film grain, soft focus, square crop。 - Suno 出 3-5 版、Midjourney 出 4 个变体,各自挑最强的一个。
- 配对测试:放 10 秒歌,同时看封面。10 秒后还觉得封面对,就成发行;如果哪里不对,说明 brief 没问题、是某一边的提示词飘了 —— 重写较弱那一边。
- 调提示词要朝着对方靠拢,不要离开 brief。如果歌比 brief 想象的更忧郁,就把封面拉过去,不要回头改 brief。
brief 模板
概念:一句话
情绪:三个形容词
色板:三到四个颜色
年代参考:年份、年代或流派
质感:三个感官描述
禁用:这次发行不是什么(3 条)
推荐流程
brief → 从 brief 推 Suno 风格提示词 → 从 brief 推 Midjourney 封面提示词 → Suno 3-5 版 + MJ 4 个变体 → 各挑最强 → 配对测试 → 较弱那一边按对方靠拢重出 → 需要文字就在外部软件里加 → 按平台尺寸导出。
首次练习
- 选一个你还没做过的歌曲概念。先把整份 brief 写完,控制在 300 字内。
- 不看 brief,凭记忆写一遍 Suno 提示词和 Midjourney 提示词。再对照 brief,看哪些地方飘了。
- 直接用 brief 的原话重写两个提示词。会发现两边更贴了。
- 生成、做 10 秒配对测试。配对成功就是一支发行;不成功就找出哪边离 brief 更远。
质量检查
- 10 秒配对测试后,歌和封面共享同一种明确情绪。
- 封面色板和歌曲的年代 / 质感对得上:暖色复古色板 + lo-fi 制作;冷色数字色板 + 干净现代制作。
- 两份提示词里没有任何元素违反 brief 的禁用清单。
- 有字(如果加了)的话,字体年代和音乐年代匹配。
- 成片按平台尺寸导出。
怎么复用这套流程
- 把 brief 模板存成笔记片段。新发行直接套那 6 个槽位。
- 建一份 brief 档案库 —— 同一项目下过去的发行可以成为后续的参考 brief。
- 维护一份”按情绪分类的 Midjourney 高质量提示词”。复用那些反复验证过的质感和年代描述。
- 每次发行前刷新一次 Midjourney 和 Suno 的版本号,两边每季度都在动,最优提示词也会跟着变。
容易踩的坑
- 先把歌做出来再去硬贴封面。先有 brief,两边提示词从 brief 派生。
- 情绪太泛(“开心、放松”)。三个具体形容词永远优于两个笼统的。
- 年代乱配。90 年代 lo-fi 音乐配 2030 年代数字封面,两边再好看也是断裂的。
- 跳过配对测试。封面和歌必须扛得住 10 秒同时存在的体验。
- 在 Midjourney 里硬加文字。文字另外用编辑软件加,Midjourney 的字基本不能直接用。
- 项目中途偷偷改 brief。如果歌情绪变了,重写 brief 再重出封面。
常见问题
- 为什么不能等歌做好再生成封面? —— 可以,但封面会”追着歌跑”,常常追不上。共享 brief 让两边从一开始就指向同一目标。
- Midjourney 的封面能商用上 Spotify 吗? —— 看 Midjourney 当下条款,付费档通常允许;但发行商(distributor)有各自的 AI 美术政策,按要求披露。
- Suno 和 Midjourney 出来都弱怎么办? —— 大概率 brief 太虚。补具体性(乐器名、颜色名、年份),两边一起重出。
- 每个封面都要字吗? —— 不一定。很多强封面就是无字的。需要在 feed 里看清歌名 / 艺人名再加。
- 封面要做多大? —— 3000×3000 能覆盖所有主流流媒体平台;社媒图按比例缩。一上来就出 3000×3000,避免后期放大。