AI 专辑封面实操:缩略图也能识别

做出能扛过 Spotify 64 像素缩略图的 AI 专辑封面 —— 构图、配色、字体,以及一小时内出终稿的迭代节奏。

大多数 AI 专辑封面过不了缩略图这关:原图很美,到 Spotify 歌单里的 64 像素就糊成一团。这篇给你一套构图脚手架、一份配色纪律,以及一套字体叠加流程,让封面缩小之后还像你的;再加一个一小时迭代闭环,比闭眼重生 30 张靠谱得多。

本文覆盖什么

一套能扛缩略图压缩的 AI 封面流程:一个主形状、双色对比、不和图打架的字体,以及一个一小时内出终稿、而不是熬一晚的迭代闭环。

这篇适合谁

自发行到 DSP 的独立音乐人、用着默认封面模板的播客主、在 Bandcamp 卖 beat 的制作人,以及那些需要给 SoundCloud 或 YouTube 上传配封面、但没必要每次都请设计师的创作者。

什么时候适合用

单曲发行、EP、mixtape、beat 包封面、播客单集封面、YouTube 音乐上传、Bandcamp 数字发行,以及任何”母带做完当天就要封面”的情况。需要印刷级 CMYK 的厂牌封面不适用 —— 那还是需要人类设计师。

开始前准备

  • 把曲子听两遍,写下三个形容词 —— “冷、急、洗白” —— 封面要让你感到的就是这三个词。空泛的 prompt 出空泛的封面。
  • 打开 Spotify,滚到任意歌单,盯着行的实际尺寸看。这就是你封面要过的那一关。
  • 提前定好规格:3000x3000 像素正方形、sRGB、大多数 DSP 要求 4 MB 以内。不要在 1024 出图最后再放大,细节会丢。
  • 决定标题和艺人名是放进图里,还是后期叠 —— 两种都行,但中途切换会浪费 credit。
  • 收集你所在风格过去 12 个月里两张你希望是自己做的封面。按它的优点命名 —— “那种留白”、“那种偏轴的人脸”、“那种双色”。

一步一步操作

  1. 从单形状 brief 开始:“一个主形状占据 60% 画面”。能扛缩略图的封面几乎都是一个形状在挑大梁。
  2. 加上强对比的双色 —— “深牛血红和骨白”、“冷钴蓝和尘奶色”。三色是上限,到四色就会在缩略图里糊成泥。
  3. 主体写具体:不是”抽象的能量”,而是”一个从后面拍的人物,肩到头顶,背景一面洗过的粉色平墙”。具体主体抗压缩,抽象不行。
  4. 加上摄影 / 插画模式:“Pentax 67 + 过期胶卷”、“riso 印刷、双色叠印、轻微错位”、“油画厚涂、调色刀、不要细节”。挑一个传统,模型认得这种”长相”。
  5. 最后加质感词:“看得到颗粒、轻微 halation、墨下面有纸的质感”。不加,默认就是干净的数码味 —— 大多数音乐不要那个气质。
  6. 同一个 prompt 出 8 张。在图像工具里把每张缩到 150 像素,先用小图判断。
  7. 挑出缩略图状态下最强的 1-2 张,做定向修改 —— 一次只换配色、形状或质感中的一个。

第一次跑的练习

  1. 选一首你已经发过的曲子 —— 你有听众数据,也有对比的旧封面。
  2. 完整 prompt 跑一次,原始结果先存下来,不要调。
  3. 在 150 像素和 64 像素下看。糊掉的全 reject。留下来的,记下它符合哪条构图规则。
  4. 第二轮只换一个变量 —— 如果构图已经站得住,最高杠杆的换法就是配色。

质量检查

  • 64 像素下还能看出主体是什么吗?认不出,就是形状太碎或者中间调太多。
  • 对比度在干活吗?把图转灰度,灰度里仍有清晰剪影的,去任何信息流里都能识别。
  • 标题位置是不是避开了主体焦点?字压在脸或手上是 AI 封面最常见的翻车。
  • 质感和音乐对得上吗?lo-fi 磁带专辑配超干净的数码味就别扭;干净录音室作品配有意的颗粒就显得有风格,不显得偷懒。
  • 流媒体会裁出问题吗?导出之前先在平台的方形预览里看一遍 3000x3000 居中效果。

怎么复用这个流程

  • 把胜出的 prompt 按情绪命名存为模板,不要按发行命名:“冷-急-缩略图”、“暖-饱和-不插电”。情绪会在多次发行里复用。
  • 建一个”缩略图测试”文件夹,放 150 像素导出图 —— 这是你对自己听众什么有效的视觉资料库。
  • 每 4-6 次发行重测一次模板;模型默认值会变,你的质感词可能就不需要了。
  • 配一套固定字体系统 —— 标题一种 display、credits 一种 mono —— 字在图像编辑器里加,不要写进 prompt。prompt 里的字很难干净读出来。
  • 建一个”差一点的废稿 + 备注”文件夹 —— 每张写一句”是哪一点没顶住”。三个月后回来比翻 prompt 历史快得多。
  • 出姐妹曲时,从胜出 prompt 开始只动一个元素 —— 通常是配色。一组曲子在缩略图扫一眼应该看得出是一家。

推荐流程

单形状 brief + 双色配色 + 具体主体 + 媒介质感 → 8 张变体 → 150 像素缩略图测试 → 留两张候选 → 定向换一个变量 → 后期加字。如果前 8 张回来都是没有主形状的满屏混乱,是 brief 写错了,不是模型 —— 先重写形状那行再重生。重要单曲的终稿过一遍图像编辑器(曲线、轻微加颗粒),3000x3000 sRGB JPG 控制在 4 MB 以内导出。

容易踩的坑

  • 没有单一主形状 —— 复杂封面到 200 像素以下就糊,Spotify 缩略图就是 64
  • 三四种颜色饱和度差不多 —— 中间调过多是缩略图杀手第一名
  • 字直接写进 AI 生成里 —— 字会变形、字距乱、想换字还得重做
  • 在 1024 像素出图然后放大 —— DSP 会拒糊图,细节也已经没了
  • 只看原图 —— 95% 的时间封面活在缩略图里,先在那儿判断
  • 模糊的情绪词 —— “氛围感”、“很酷”、“美学”每次都出一样的平均脸
  • 挑最”好看”的那张当终稿,而不是挑最有辨识度的那张 —— 好看是低门槛,缩略图能认出来才是真门槛
  • 跳过灰度测试 —— 灰度能站住的封面在任何背景下都能站,灰度站不住的会被复杂信息流吃掉
  • 把一张还可以的变体直接当终稿 —— 第二轮才是封面真正变成”你的”的那一步

常见问答

  • 那个露骨内容 E 标怎么办? —— DSP 自己加的,不用你管;设计时假设右下角有时会被压住,那块留干净就行。
  • 能不能一张封面用一整张 EP? —— 可以,每首做一个小变体(换配色、换字位)。视觉系统更连贯。
  • DSP 会拒绝 AI 封面吗? —— 目前不会,但规则在收紧。保留你的 prompt 日志和源文件,平台问到出处时有据可查。
  • 黑胶封面呢? —— 流程不同 —— 12x12 英寸 300 dpi 至少 3600x3600,屏幕上想要的质感在印刷上经常糊。印刷版另出一遍。
  • 只做正方形还是带 banner 变体? —— 先出一张 3000x3000 母版,再裁切或扩绘成 banner / 故事 / 海报变体。不要从头重生 —— 视觉身份会丢。
  • 多少次重生算太多? —— 跑过 40 张还选不出来,问题在 brief。停下来,把形状那行和配色那行重写,再从头跑。
  • 封面要严格贴合音乐风格吗? —— 贴情绪,不贴风格俗套。一张民谣专辑用刻意工业感的封面,常常在信息流里跑得过又一张木吉他配木地板。

FAQ

Q:为什么 64 像素的缩略图测试这么重要? A:因为 95% 的听众第一次看到你的封面就是 Spotify / Apple Music 信息流里的 64 像素行。原图再美,缩略图认不出主体就等于零曝光。导出前一定先缩到 150 / 64 像素看一遍。

Q:标题字能直接写进 AI prompt 吗? A:不建议。AI 生成的字几乎都会变形、字距乱、想改字还得重生。最稳的做法是先出干净的图像母版,标题和艺人名后期在图像编辑器里另加图层。

Q:DSP 现在会拒绝 AI 生成的封面吗? A:目前主流 DSP 不会,但规则在收紧。保留你的 prompt 日志和原始输出文件,平台事后追问出处时能交代得过去。要印刷的黑胶封面还得另出一版 3600x3600 300 dpi 的。

Q:一组单曲怎么保持视觉一家亲? A:从胜出 prompt 开始只动一个元素(通常是配色或主形状位置),其他保持。把胜出 prompt 按情绪命名存模板——“冷-急-缩略图”比“2026-04-单曲”有复用价值。

相关

标签: #Midjourney #album-art #cover-design #教程