Discord 还是网页端？

网页端，除非你特别想要社区氛围。网页编辑器更快、Draft Mode 一键开启、历史可搜索。

`--style raw` 和 `--cref` 被什么替代了？

在 V7 里，照片模式现在直接写 `--raw`；角色 / 物体一致性从已弃用的 `--cref` 转到了 **Omni Reference**（`--oref` 配 `--ow`）。在 V7 上用 `--cref` 会报错。

为什么我的图都"很 Midjourney"？

加 `--raw`、降低 `--s`（试 50-100）、在 prompt 里指名某个具体摄影师或导演。还要确认你的个性化档案已解锁。

怎么做一致的角色？

用 `--oref [URL] --ow 100`。2026 年它不错但不完美——整体身份能保住，细节仍会在不同出图间漂移。

Midjourney 的 API 受限且需申请；生产 pipeline 里多数团队还是驱动网页 UI 或用第三方封装。

能在图里写字吗？

能力弱。1-3 个词一般能渲染；更长的文案即便在 V8.1 里也会扭曲。做海报就先生成视觉，再到 Figma 或 Canva 里加字。

AI 工具教程

Midjourney 新手指南（V7 / V8.1，2026）

30 分钟从空白 prompt 框跑到可用图：一句话 prompt 公式、真正起作用的 5 个参数（--ar / --raw / --s / --sref / --oref）、Draft Mode 草稿模式，以及高手在用的迭代闭环——已更新到 V7 与 V8.1。

发布于: 2026/05/17 更新于: 2026/06/04 作者: AI Productivity Guide Team 🌐 查看英文版本

一句话总结

Midjourney 是市面上风格最”有主见”的图像生成器：想要”调调”时它很出色，想要逐像素控制时它很折磨。截至 2026 年 6 月，默认模型是 V7（自 2025 年 6 月起为默认），网页端还能用到 V8.1——它在 2026 年 4 月 30 日发布，是目前最快的模型。这篇能让一个全新用户在 30 分钟内从空白 prompt 框跑到可用图，靠的是一句话 prompt 公式、5 个参数和一个紧凑的迭代闭环。新手最大的一个升级：把 prompt 写成一句话，加上 --ar 和 --raw，然后一次只改一个变量重跑。

这篇适合谁看

Discord 或网页端 midjourney.com 的 Midjourney 新人。不需要任何 image prompt 经验，只要有”主体 + 风格 + 灯光 + 镜头”这样的基础心智模型。

先选档位（截至 2026 年 6 月）

免费 trial 已经没有了，必须付费订阅。各档按 “Fast GPU”（快速、免排队的生成）小时数计费。Standard 及以上增加 Relax Mode（较慢，但生成次数不限、不额外消耗 GPU），Pro 及以上增加 Stealth Mode（图片保持私密）。

档位	月付	年付（每月）	Fast GPU / 月	Relax Mode	Stealth Mode
Basic	$10	$8	约 3.3 小时	无	无
Standard	$30	$24	约 15 小时	有	无
Pro	$60	$48	约 30 小时	有	有
Mega	$120	$96	约 60 小时	有	有

学习阶段 Basic（$10/月） 够用，但你一边迭代，Fast GPU 很快就见底。如果每天都生成，Standard（$30/月） 第一周就回本——因为 Relax Mode 去掉了”每张图都在烧钱”的焦虑。当前价格见 Midjourney 官方档位页。

开始前准备

先解锁 Personalization（个性化）。 V7 默认开启模型个性化，但在你给大约 40-200 组图片打过分（在设置 → Personalization 里大约花 5-20 分钟）之前，它一直处于未激活状态。不解锁的话，V7 会悄悄退回到通用风格，你的出图会比网上的示例更平淡。
新人优先用网页端，不要 Discord。 历史可搜索、编辑器更快、Draft Mode 一键开启。打开 midjourney.com/explore。
先想清楚用途——缩略图、首屏大图、角色参考、情绪板。每种需要不同画幅和风格化强度。
抓风格参考。 在 Explore 里找 2-3 张你想要的图，复制它们的 --sref 代码。这是锁系列风格最快的路径。

prompt 公式

把 prompt 写成一句话，而不是一堆逗号堆叠：主体 + 风格 + 灯光 + 镜头。

a corner bookstore at golden hour, warm window light spilling onto worn wooden shelves, 35mm photographic, shallow depth of field --ar 16:9 --raw

解析器对一句自然的话理解得比 12 个堆在一起的形容词更好。然后把参数加在结尾。

具体步骤

写一句话 prompt（主体 + 风格 + 灯光 + 镜头），如上。
用 --ar 设画幅。 --ar 16:9 首屏、--ar 9:16 竖屏 / 快拍、--ar 1:1 缩略图。默认是正方形，会毁掉任何 banner。
加 --raw 拿照片感。 这是 V7 里替代旧 --style raw 的写法。不加，V7 会套自己的”家味”（暖、略带绘画感、戏剧光），离写实越来越远。
用 Draft Mode 廉价探索。 点 ⚡ 按钮或加 --draft。草稿模式大约快 10 倍、GPU 成本只有约一半——先探 20 个想法，再把入选那个用全质量重跑。
一次重跑只改一个变量。 太饱和？去掉 vivid、加 muted palette——别同时换主体，否则你分不清是哪个改动起了作用。
用 --sref [代码] 锁风格，把同一套美学贯穿整个系列，不用每次重写 prompt。
只 upscale 最终入选的那张。 Upscale 额外耗 GPU 时间，还会锁死构图，所以先探索。

真正起作用的 5 个参数

参数	作用	新手默认
`--ar W:H`	画幅。永远要设。	首屏 `--ar 16:9`，缩略图 `--ar 1:1`
`--raw`	去掉 Midjourney 自带风格，更字面 / 更照片感。	产品图、写实时开
`--s N`（`--stylize`）	0-1000，默认 100。越高越自由发挥。	品牌项目 50-150，艺术 250-500
`--sref [代码]`	风格参考。锁系列美学。	从 Explore 抓 1-2 个代码
`--oref [URL] --ow N`	Omni Reference（V7）。让人物 / 物体跨图一致；`--ow` 为 0-1000，默认 100。	`--ow 100` 加强约束

V7 重要变化： 旧的 --cref（角色参考）在 V7 里不能用——会报错或被忽略。它的替代是 Omni Reference（--oref），它会从参考图里混合角色和风格线索。注意 --oref 大约要花 2 倍 的常规 GPU 时间。其他（--chaos、--weird、--tile）都是小众，第一遍可以跳过。

建议的操作流程

Explore → 抓 1-2 个 --sref 代码
→ 写一句话（主体 + 风格 + 灯光 + 镜头）
→ 加 --ar + --raw，开 Draft Mode
→ 生成 4 张草稿，选最好的
→ 把入选那张只改一个变量、用全质量重跑
→ 最终 upscale

学习期一张成品预算大约 15 条 prompt。有了 Draft Mode 这很便宜。

V7 还是 V8.1：选哪个模型？

	V7（默认）	V8.1（2026-04-30）
速度	基准	快约 4-5 倍
HD / 2K	无	有，用 `--hd`（比早期 HD 快 3 倍、便宜 3 倍）
美学	电影感、艺术化	与 V7 风格一致，手部和细节更稳
适合	大多数新手	需要 2K 或精细细节的最终出图

先用 V7 学控制，需要 HD 或更干净的手部时再切到 V8.1（网页端）。两者都要求先解锁个性化档案。

FAQ

Discord 还是网页端？：网页端，除非你特别想要社区氛围。网页编辑器更快、Draft Mode 一键开启、历史可搜索。
--style raw 和 --cref 被什么替代了？：在 V7 里，照片模式现在直接写 --raw；角色 / 物体一致性从已弃用的 --cref 转到了 Omni Reference（--oref 配 --ow）。在 V7 上用 --cref 会报错。
为什么我的图都”很 Midjourney”？：加 --raw、降低 --s（试 50-100）、在 prompt 里指名某个具体摄影师或导演。还要确认你的个性化档案已解锁。
怎么做一致的角色？：用 --oref [URL] --ow 100。2026 年它不错但不完美——整体身份能保住，细节仍会在不同出图间漂移。
有官方 API 吗？：Midjourney 的 API 受限且需申请；生产 pipeline 里多数团队还是驱动网页 UI 或用第三方封装。
能在图里写字吗？：能力弱。1-3 个词一般能渲染；更长的文案即便在 V8.1 里也会扭曲。做海报就先生成视觉，再到 Figma 或 Canva 里加字。

容易踩的坑

堆 10 个风格词（“cinematic moody atmospheric dramatic ethereal…”）——模型只抓住 2 个，其余忽略。
不写 --ar——正方形默认会毁掉任何首屏或 banner 裁剪。
用一长串逗号去过度控制——写一句话，解析器对意图把握更好。
跳过 Draft Mode——你在用全价 GPU 烧本该廉价的探索阶段。
太早 upscale——还没探索就把构图锁死。
忽视 --sref——它是系列品牌一致性最大的杠杆。
把每张输出都当成品——工作流是”生成十几张选 1 张”，不是”生成 1 张就指望”。

一句话总结

这篇适合谁看

先选档位（截至 2026 年 6 月）

开始前准备

prompt 公式

具体步骤

真正起作用的 5 个参数

建议的操作流程

V7 还是 V8.1：选哪个模型？

FAQ

容易踩的坑

相关阅读

相关文章

AI 专辑封面实操：缩略图也能识别

AI 奇幻角色设计实操：从角色卡到大场景

AI 时尚 Lookbook 实操：一个模特，六套造型，一套色系

怎么用 AI 生成 App 背景图

怎么用 AI 做品牌视觉方向（2026）

怎么做跨场景的一致 AI 角色图