你让 Gemini 的图像生成(Imagen 3 / Imagen 4)画”东京办公室里的女商人”、“爱因斯坦在黑板前的照片”、“桌上的 iPhone”,结果只得到”抱歉,我无法生成这张图片”,没有任何细节。有时候同一个 prompt 在 AI Studio 能过,在 gemini.google.com 不行。
Imagen 通过 Gemini 的安全过滤在当下主流图像模型里最保守。它会拦:大多数有名字的人(尤其公众人物和任何政治人物)、大多数品牌名、涉及儿童的任何场景、任何被读成医疗 / 武器 / 暴力的画面,有时连肉眼看起来完全 OK 的也会被拦。
修复通常是改写 — 用属性描述代替身份,去掉品牌名,边缘情况用 AI Studio 可调的安全阈值。
常见原因
按出现频率:
1. 提到了真名(最常见)
“Elon Musk 的照片” / “Taylor Swift 的图” / “爱因斯坦在黑板前” — 全部被拦。Gemini 上的 Imagen 拒绝生成有名有姓的真人画像,历史人物也不行。
如何判断:去掉名字就能过。
2. prompt 里有品牌名
“iPhone”、“可口可乐罐”、“Nike 鞋”、“Tesla 汽车” — 经常被拦。Imagen 把商标当风险。
如何判断:“现代智能手机”能过,“iPhone”不能。
3. 政治人物 / 政治话题
任何政治人物的名字都被拦。某些政治话题(集会、抗议)即使不点名也拦。
4. 场景里有未成年
提到儿童、小孩、未成年、甚至”年轻人”都会触发儿童安全过滤器,这块特别严。
5. 医疗 / 武器 / 暴力相关
刀、针、血、手术、枪械 — 即使是良性场景也会被拦(厨师切洋葱、医生听诊器有时过有时不过)。
6. gemini.google.com 比 AI Studio / API 更严
消费版用最严的过滤。AI Studio 上的 Imagen 让你调安全阈值。API(Vertex AI Imagen)在正确授权下最宽松。
7. 地区限制 — 某些国家完全禁
某些地区即使 AI Pro 也禁人物图像生成。
最短修复路径
步骤 1:把身份改写成属性
把真名换成描述:
不好:Elon Musk 在新闻发布会上的照片
好: 一个中年男子,短棕发,深色西装,站在科技发布会讲台上发言的照片
不好:爱因斯坦在黑板前
好: 一位年长的物理学家,蓬乱的白发和小胡子,
在 1940 年代大学教室的黑板上写公式
属性描述基本能给到你想要的视觉,又不触发真人过滤器。
步骤 2:去掉品牌名
不好:桌上的 iPhone
好: 桌上的一台现代黑色智能手机,木质桌面
不好:车库里的 Tesla Model 3
好: 车库里停着一辆红色电动轿车,极简设计,
隐藏式门把手,玻璃车顶
描述品牌长什么样,不说品牌名。
步骤 3:用 AI Studio 调安全阈值
aistudio.google.com
→ 选 "Imagen" 模型
→ 右侧 Safety settings
→ 把相关类别(HARASSMENT、HATE、
SEXUALLY_EXPLICIT、DANGEROUS)从 BLOCK_MOST 调到 BLOCK_FEW 或 BLOCK_NONE
注意:这些旋钮能调低但不能完全去掉某些类别(比如未成年)的保护。把安全调低也不能解锁真名 — 那是硬策略。
步骤 4:直接用 Vertex AI Imagen API
商用场景且有内容策略对齐需求,Google Cloud 的 Vertex AI Imagen 接口最灵活:
from google.cloud import aiplatform
from vertexai.preview.vision_models import ImageGenerationModel
model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")
images = model.generate_images(
prompt="现代办公环境,桌上有笔记本和咖啡杯",
number_of_images=4,
aspect_ratio="16:9",
safety_filter_level="block_some",
person_generation="allow_adult",
)
person_generation="allow_adult" 允许通用成年人(仍不允许真名)。
步骤 5:换 prompt 结构
有时拦的是关键词。换写法:
- “child” / “kid” 换成 “young person” — 有时过有时不过。最稳:干脆不写。
- 做饭场景把 “knife” 换成 “kitchen tool”。
- 想说照片用 “photograph” 不要用 “shot”(枪意过滤器)。
步骤 6:接受有些就是硬拦
真名、任何场景下的未成年、品牌为主体、医学影像 — 这些是策略,不是 bug。如果业务需要,要换工具(授权的图库、专业摄影,或者对你具体用途策略更宽的图像模型)。
预防
- 养成按属性描述视觉,不按身份描述的习惯 — 在所有当前图像生成工具上都通用,且避开大多数拦截
- 笔记里留一份”改写映射”:常见品牌名 → 通用描述
- 商业 prompt 要交付的,用 Vertex AI Imagen API,不要和消费版过滤器纠缠
- 永远不要在 prompt 里写私人个人的真名 — 私人隐私过滤比公众人物还严
- 敏感行业(医疗、安全)先想清楚图像生成是不是合适的工具