这篇讲什么
多数人手机上用 ChatGPT 跟电脑一样——在对话框里打字——体验严格变差:屏幕更小、键盘更慢、没第二块屏。这篇讲手机真正赢的场景:语音捕捉进 Project、拍照提问、任意 App 的 Share Sheet、桌面小组件一键入口。再加上那些你该停止在手机上做的事。
这篇适合谁看
电脑上已经用熟 ChatGPT、觉得手机版本是降级的人。某些工作流确实是降级;另一些(捕捉、当下提问、走路时语音对话)手机才是合适设备。目标是分清是哪种。
什么时候适合用
- 脑子里刚冒出一个想法,要在它蒸发前抓住。
- 你正站在一个东西前面(标签、菜单、招牌、截图),对它有疑问。
- 在开车、走路或者手忙不开,想把一个问题讲出来。
- 一个快问快答,懒得切到电脑上去处理。
开始前准备
- 装官方 ChatGPT App(App Store / Play Store)。第三方客户端拿不到语音和 Share Sheet 集成。
- 把 ChatGPT 小组件加到桌面。一键进语音的入口决定了你实际使用频率。
- 用和电脑同一个账号登录,确认同步在工作。不工作的话看端云同步排错。
- 想好你的”手机 Project”——通常叫”Capture”或”Inbox”——让脑里冒出的想法落在一个你会回头看的地方。
具体步骤
-
建一个 Capture Project,命名”Inbox”,系统指令大致:
这个 Project 专用于手机端语音快速捕捉。 收到一条短语音,就 acknowledge 并存档。 我问"总结一下本周捕捉的内容"时,按主题分组, 把重复出现 2 次以上的点拎出来。 -
用语音模式思考,不是打字。点波形图标,说 30-60 秒,模型转写并回应。改语音转写比拇指打 200 字快得多。
-
拍照 + 提问处理一切视觉问题。拍菜谱、停车标识、报错截图、白板,然后问:
这个标识什么意思?周日下午 2 点能停吗?视觉模型做日常解读够用。不要拿它读法律或医疗文件。
-
用 iOS / Android 的 Share Sheet。在 Safari、邮件、备忘录、任何第三方阅读器里,分享 → ChatGPT,写”总结”,就有了一个带上下文的对话,省去复制粘贴折腾。
-
长任务要做交接。手机上:“给我列一个我想写的内容的 3 条 bullet 大纲”。打开电脑,对话已经在侧栏里,把大纲展开成稿。手机管捕捉,电脑管展开。
-
用小组件做一键入口。iOS / Android 小组件可以直接点进语音、图片输入或某个具体 Project。摩擦力降下来的效果是真实的,靠你实际用的频率来量化。
一个适合手机的捕捉 prompt
[语音备忘,走路时]
我刚有个想法关于 {主题}。切入点是 {angle}。风险是 {risk}。
捕捉并打标签。如果我本月之前提过 {主题},
提醒我当时说了什么,这次的想法和之前哪里不同。
第二行是把捕捉从”记录堆”变成”能累积”的关键。
完成后检查
- 重看一遍语音转写再依赖它。模型偶尔会把专有名词和数字听错。
- 拍照提问后问一句:“如果照片再模糊一点,你哪些会答错?“——这能暴露它在猜还是在读。
- 核对 Share Sheet 的捕捉是否落到正确的 Project——偶尔会进默认对话。
- 嘈杂环境用语音模式时,切到按住说话(长按波形),避免早结束。
怎么复用这套流程
- 维持一个 Capture Project 加一个按主题分的 Project(比如”旅行规划”)。手机上浏览十几个 Project 不现实。
- 养成习惯:走路 = 语音模式,跑腿 = 拍照提问,通勤 = Share Sheet 阅读筛选。
- 反复问的问题(“日出几点?""换成公制”),在 prompt 菜单里存起来,不要每次重打。
建议的操作流程
点小组件 → 语音捕捉进 Inbox Project →(如有视觉)附图 → 200 字以上的展开交给电脑 → 周末回看本周捕捉汇总。
容易踩的坑
- 在手机上写长稿。拇指打字慢到让模型的输出跑在你的判断前面。
- 在手机上做代码评审或需要并排阅读的事。屏幕小到没法 diff。
- 忽略语音转写在数字上的错。“4.5 万”可能悄悄变成”45 万”。要据此行动的数字都核一遍。
- 让语音模式在你想到一半时自动结束。要么用按住说话,要么分成更短的片段。
- 不装小组件。“解锁手机 → 找 App → 点麦克风”的摩擦力足够杀掉这个习惯。
- 忘了登录不一致很常见——手机和网页偶尔会漂。如果对话不同步,看手机网页登录不一致排错。
FAQ
- 该用语音模式还是系统听写?: 思考、要语音回复(走路时舒服)用语音模式;想原样记下某句精确表达用系统听写到文本框。
- 手机能离线用 ChatGPT 吗?: 不行。每次查询都要网。要离线的话先记到笔记 App,回头粘进来。
- 手机 App 比网页少了什么?: 部分 Canvas 风格编辑、更长的文件上传在网页更顺。语音、图像捕捉在手机更顺。
- 语音模式耗电吗?: 屏幕开着用 30 分钟以上明显耗电。长时段要插电,或者用按住说话让屏幕休眠。