任务场景
你在自学——大学某章、证书科目、一个编程概念、外语单元——需要一份真的能测理解、不是只测背诵的小测。题型要混合,答案先隐藏,再用结构化方式重测错题。
哪些情况适合让 AI 来做
- 有笔记或教材,但没有老师给的题库。
- 备战高利害考试,需要 50-200 道练习题。
- 你在教别人,要快速产出不同题型。
- 双语学习,要两种语言的题。
什么时候不要完全依赖 AI
- 高利害认证(医学、法律、安全证),题目必须来源可查。
- 入门以上的数学——模型在多步证明和特殊记号上仍翻车。
- 近期变化的话题,可能超出模型训练截止。
- 任何”答案错一道就误导学习者”的场景。
需要先给 AI 的信息
- 全文笔记或章节。
- 难度(高中、本科、职业考试、爱好者)。
- 题量和比例(记忆、应用、分析)。
- 题型(选择、简答、补全代码、问答)。
- 反模式清单:不要脑筋急转弯,不要题干里含答案。
可直接复制的 Prompt
你是学习科学背景的出题人,从笔记出一份自测。
源笔记:
"""
{notes}
"""
难度:{level}
题量:{n}
题型比例:{format_mix}
认知层级比例:
- 50% 记忆(Bloom: 记住、理解)
- 30% 应用(把概念用到新情景)
- 20% 分析(比较、评估、论证)
规则:
- 每道题只能从笔记内回答出。
- 选择题干扰项要"似是而非",不能明显错。
- 答案键里每题加一句话解释。
- 每题标认知层级。
- 题目结束后插入分隔线,再放答案键。
- 笔记里有歧义的题加 "[verify]" 标记。
建议让 AI 输出成什么样
带题型标签的编号题目 + 分隔线 + 格式为”Q1. 答案——一句话解释”的答案键。这样自评和重测最方便。
怎么判断 AI 的结果能不能用
- 随机抽 5 道对照笔记。模型添油加醋就用更严格约束重生成。
- 盖住答案冷做一遍,再老实评分。
- 答案键里需要精确(数字、日期、名称)的地方有没有被改写?
- 错题 24 小时后再测一次,1 周后再测一次——间隔提取才出效果。
容易踩的坑
- 全记忆题,做完很爽但理解没深化。
- 选择题干扰项太弱,不看题干都能选。
- 让模型超出笔记内容自由发挥(听起来更厉害,但测试失真)。
- 没有重测计划——一次性的小测留不下知识。
下一步怎么改得更好
每次测完把错题记进”薄弱话题”文件。下次 prompt 直接说”在这三个话题上增加应用题比重”。几周下来,你会有一份针对自己真实差距的私人题库。
实操加深
做「AI 出题:把笔记变成真能练出掌握度的自测」这类任务时,AI 输出质量主要取决于输入包是否完整。至少给它受众、原始材料、目标格式、你要做的决策,以及一好一坏两个参考。第一轮先要求保留事实,第二轮再优化结构、语气或表达,不要让模型一边猜事实一边润色。
拿到结果后单独做一次复核:有没有遗漏限制、编造细节、行动项不清、语气和真实场景不符。最终稿最好能马上使用,包含明确对象、下一步和判断标准,而不是还需要别人重新解释一遍。
FAQ
- 一次测多少题? 集中复习 10-20 道;考前累积复习 50+。
- 错题多久重测? 24 小时、1 周、1 个月。
- 选择题还是简答好? 简答更练提取;选择更快。混合用。
- AI 能批改我的作文吗? 粗反馈可以。实质内容一定要回查源笔记。
相关阅读
更深的学习流程参考 出题 prompt、闪卡 prompt、学习计划 prompt。