ChatGPT 做翻译——比贴上去就让它翻好得多

先建术语表、保留语气、做回译核验——区分机翻能看和能上线发表的关键步骤。

这篇讲什么

把 3000 字塞进 ChatGPT,说”翻成日语”,出来的东西通顺、合语法、语气一半是错的——品牌名被翻了,作者的声音被磨平,俚语变成像维基百科一样的转述。这篇是产出要能发表(不只是能看懂)时我用的流程:先建术语表,再贴原文 + 术语,给语气指令,最后用回译做差异核验。

这篇适合谁看

译文会被在意的母语者读:做本地化的市场、用第二语言发表的研究者、给非英语董事会写更新的创始人。读者只要懂大意,贴了就发也行;如果他们会挑某个动词不顺、品牌名被翻成普通名词,你需要一套流程。

什么时候适合用

  • 营销文案本地化,语气和品牌词都重要。
  • 长文(1000-5000 字)翻译,需要保留作者特定的声音。
  • 双语文档输出,多个文件之间术语必须一致。
  • 领域文本(法律、医疗、技术),术语错了有真实成本。

开始前准备

  • 选模型。法律或技术材料、需要推理的用 GPT-5;常规文案用 GPT-5.5;GPT-5.4 只用在低风险初稿。
  • 想清楚哪些词不能翻(品牌名、产品 SKU、代码标识符、人名)。写下来。
  • 想清楚要保留的语气——直白、正式、口语、营销腔——并在目标语言里找一段 100 字左右的同语气样本作为锚定。
  • 给这个语言对开一个 Project,记忆和术语表都圈在里面——别污染你的通用对话。

具体步骤

  1. 从原文里抽术语表。贴 500-1000 字,让它:

    抽出本文中所有需要刻意决定翻译选择的词:
    品牌名、产品名、技术术语、俚语、反复出现的短语。
    输出表格:源词 | 建议译法 | 原因 | 是否保留原样 (Y/N)。
  2. 人工过一遍术语表。品牌名锁成”保留原样”。每个反复出现的技术术语只挑一个译法。这一步是杜绝第 6 页才出现的不一致的关键。

  3. 分节翻译(每次 500-1500 字),顶头贴锁定的术语表:

    把下面这一节从英文翻成日文。
    术语表(必须严格遵循):[贴表]
    语气:口语,像创始人写给早期用户。
    保留段落断行。不要总结或缩短。
  4. 对可疑段落做回译核验:

    把这段日文直译回英文,保留结构。
    不要润色——我要看到漂移。

    对照原文。事实性名词或数字的漂移是真问题;形容词漂一点一般可以。

  5. 俚语或文化负载短语,要 3 个备选,每个一句话讲连带的含义,再挑:

    把"we shipped it warts and all"翻成日文营销文案,给我 3 种译法,
    每种用一句话说明它带的语气含义。
  6. 终稿:母语者通读。这套流程能把你带到 90%,最后 10% 是人的判断。

一份能压住幻觉的 prompt

你在把英文翻成 {目标语言},产出要发表。
约束:
- 严格使用我贴的术语表,不要给表里的词另造译法。
- 保留作者的声音:[贴 100 字语气样本]。
- 源文有歧义就在行内标注 [AMBIGUOUS: ...],不要猜。
- 不要为了缩短句子而转述,长度尽量对齐。
- 数字、日期、专有名词必须原样回还。

这能抓到那些模型本来会”默默磨成半个意思”的位置。

完成后检查

  • 随机抽 3 段做字面回译。盯事实性名词和数字,不必在意风格上的微调。
  • 对术语表做查找替换核对——每个锁定词都该是锁定译法,无例外。
  • 用目标语言把第一段和最后一段朗读出来。听着像译文,说明语气 prompt 没生效。
  • 核品牌名、URL、产品 SKU 是否原样保留——这是最常见的”被悄悄改了”的位置。

怎么复用这套流程

  • 每个语言对的 Project 连同术语表一起存档,下次直接复用。
  • 维护一个 translation-voice-samples/ 文件夹,存你常打的每种语气的 100 字锚定样本。
  • 团队用的话,术语表存成 CSV,工程、市场、客服共用一份译法。

建议的操作流程

抽术语表 → 人工审表 → 分节翻译时把术语表钉在顶部 → 对可疑段落做回译差异 → 俚语要备选 → 母语者终读。

容易踩的坑

  • 一次把整篇贴进去。长篇下来语气一致性会崩,模型尾段会漂向通用风格。
  • 跳过术语表。品牌名被翻、技术术语在全文里出现三种不同译法。
  • 只说”自然”不给语气锚。“自然”会被解读成模型在该语言的默认风格,平淡。
  • 把回译当无损。它不是——但事实性内容的漂移是一个值得追查的红灯。
  • 法律或医疗用快模型。风险和取舍不匹配。
  • 忘了 ChatGPT 在低资源语言(部分东南亚或非洲语言)训练较弱,质量下降、回译漂移更大。早一点让人来审。

FAQ

  • 翻译用 ChatGPT 比 DeepL 强吗?: 短且常规的文本 DeepL 经常更干净。要术语控制、保语气、给领域指令时 ChatGPT 赢。可以 DeepL 出初稿、ChatGPT 做打磨。
  • 代码注释和文档能用同一套吗?: 可以,但术语表里要明确写”代码标识符、变量名、字符串字面量原样保留”。靠近代码的散文是翻译最容易出错的地方。
  • 能保留 markdown / HTML 吗?: 大致能,偶尔会丢标签或把标题层级移位。译完和原文 diff 一下。
  • 语音模式能翻译吗?: 旅游级对话有用。要发表的产出没用——没术语表、没回译、没审计。

相关阅读

标签: #ChatGPT #工作流