Midjourney 新手指南

30 分钟从空白 prompt 框跑到可用图:一句话 prompt 公式(主体 + 风格 + 灯光 + 镜头)、真正起作用的 5 个参数(--ar / --style / --sref / --no / --v)、迭代闭环。

这篇讲什么

Midjourney 是市面上风格最”有主见”的图像生成器——这在你想要”调调”的时候很好用,在你想要”控制”的时候很折磨。这篇是一份能让一个全新用户在 30 分钟内从盯着空白 prompt 框跑到产出可用图的速查:prompt 公式、真正起作用的 5 个参数、以及高手在用的迭代闭环。

本文涉及的工具 / 概念:

  • Midjourney: 主流 AI 图像生成产品,以高质量风格化输出闻名,通过 prompt 加后缀参数(--ar--style--sref)控制。

这篇适合谁看

Discord 或 midjourney.com 网页端的 Midjourney 新人。不需要任何 image prompt 经验,但需要有”主体 + 风格 + 灯光”这样的基础心智模型。

什么时候适合用

注册完、付完基础档、前 10 条 prompt 跑出来的全是网上吐槽过的那种俗气 stock 风格——这篇就是为接下来的第 11-20 条 prompt 写的。

开始前准备

  • 至少订 Basic 档(约 $10/月)——免费 trial 点数很快用完,且不含最快的模型。
  • 新人优先用网页端(midjourney.com/explore)而不是 Discord——UI 迭代体验差太多。
  • 先想清楚用途:缩略图、首屏大图、角色参考、情绪板。每种需要不同画幅和风格化强度。
  • 打开 Explore 找 3 张你喜欢的图。后面用 --sref 做风格参考。

具体步骤

  1. prompt 写成一句话:主体 + 风格 + 灯光 + 镜头。例:bookstore at golden hour, warm window light, 35mm photographic, shallow depth of field
  2. --ar 控制画幅。 --ar 16:9 首屏、--ar 9:16 竖屏、--ar 1:1 缩略图。默认是正方形。
  3. --style raw 降低风格化 ——想要照片感时用。不加的话 Midjourney 会往插画风方向推。
  4. 一次重跑只改一个变量。 太饱和就把 vivid 去掉、加 muted palette——别同时换主体。
  5. --sref [URL] 做风格迁移,参考你自己的图或 Explore 里的图。这是锁系列风格最快的方法。
  6. 挑定最终候选再 upscale。 Upscale 耗点数也会锁死构图。

真正起作用的 5 个参数

  • --ar W:H —— 画幅。永远设;默认正方形。
  • --style raw —— 减少 Midjourney 自带风格、更照片感。产品图、写实首选。
  • --stylize N(缩写 --s N)—— 0-1000。越高越艺术自由发挥。默认 100。品牌项目 50-150,艺术 250-500。
  • --sref URL —— 风格参考。锁系列美学,不用每次重写 prompt。
  • --cref URL —— 角色参考。保持人物 / 角色一致。配 --cw 100 加强约束。

其他(--chaos--weird--tile)都是小众,第一遍可以忽略。

建议的操作流程

Explore 找灵感 -> 抓 1-2 个 sref URL -> 写主体 + 风格 + 灯光 + 镜头 -> 加 --ar + --style raw -> 生成 4 张变体 -> 选 1 张、只改一个变量再跑 -> 最终 upscale。学习期一张成品预算大约 15 条 prompt。

FAQ

  • Discord 还是网页端?: 网页端,除非你特别想要社区氛围。网页快、历史可搜。
  • --style raw 和不加 style flag 差别?: 不加,Midjourney 会套自己的”家味”(暖、略带绘画感、戏剧光)。加上后更接近照片或你字面描述的样子。
  • 为什么我的图都”很 Midjourney”?: 降 --stylize、加 --style raw、在 prompt 里指名某个具体摄影师或导演的风格(“in the style of Wes Anderson framing”)。
  • 怎么做一致的角色?: 用 --cref 引用你最满意那张的 URL。2026 年别期待完美——脸型能保留,细节会漂。
  • 有 API 吗?: 官方 API 受限;生产 pipeline 现在还是 V6/V7 网页 UI 或第三方封装。
  • 能在图里写字吗?: 一般——1-3 个词大致能行,长文本会扭。海报带文案就先生成视觉,再到 Figma 里加字。

容易踩的坑

  • 堆 10 个风格词(“cinematic moody atmospheric dramatic ethereal…”)——模型只挑 2 个,其余忽略。
  • 不写 --ar——默认正方形会毁掉任何首屏 / banner 用途。
  • 用一长串逗号分隔的词去过度控制——写一句完整的话,解析器对意图把握更好。
  • 太早 upscale——还没探索就把构图锁死。
  • 忽视 --sref——它是品牌一致性最大的杠杆。
  • 把每张输出都当成品——工作流是”生成 16 张选 1 张”,不是”生成 1 张就指望”。

相关阅读

标签: #教程 #Midjourney #图像生成 #入门