ChatGPT语音模式使用教程:走路也能聊的Voice Mode设置与语言调整

学会了 Temporary Chat——不让对话进历史。但走路、做饭、练口语时,我反而更常用 Voice 语音模式:不用打字,直接和 ChatGPT 说话。很多人第一次点错 输入框旁的小麦克风——那是 dictation(语音转文字),录完还得自己点发送;Voice Mode 才是 整段语音对话。
本节在系列里讲什么
ChatGPT 使用指南 共 10 讲。本讲只练 Voice Mode:怎么开、和 dictation 差在哪、语言怎么设。生成图片从第 7 讲起。
官方文档链接(建议收藏)
- Help Center:https://help.openai.com
- 本讲 · Voice Mode FAQ:https://help.openai.com/en/articles/8400625-voice-mode-faq
- Advanced Voice FAQ:https://help.openai.com/en/articles/9617427-advanced-voice-mode-faq
- Voice Dictation FAQ(别和 Voice Mode 混):https://help.openai.com/en/articles/12168547-voice-dictation-faq
- 语言识别 · Main Language:https://help.openai.com/en/articles/8459293-why-does-the-voice-input-detect-a-different-language-from-the-one-im-speaking
- 第 5 讲 · Temporary Chat:https://help.openai.com/en/articles/8914046-temporary-chat-faq
先把两个「麦克风」分清楚
OpenAI Help 把 dictation 和 Voice Mode 分开写,我习惯记成:
| 入口 | 你在干什么 | 典型场景 |
|---|---|---|
| 输入框 麦克风 | 录音 → 转文字 → 你再点发送 | 长段落口述、不想手打 |
| 耳机 / 波形图标 | 进入 语音对话界面,边说边听回复 | 走路 brainstorm、练口语 |
Dictation FAQ 写:录音会随 聊天历史 保留(删聊天后约 30 天内删音频);Voice Mode FAQ 讲的是 另一套语音会话能力。所以我查敏感资料仍用第 5 讲的 Temporary Chat;Voice 里聊的内容 默认会进普通对话历史——别在 Voice 里念身份证号还指望「不留痕」。
浏览器跟做:开 Voice Mode
Web 端(与 chatgpt.com/features/voice 一致):
- 打开 chatgpt.com,进任意 普通对话(Temporary Chat 也能开 Voice,但隐私边界见上)
- 看输入栏右侧 耳机图标(不是输入框里的小麦)→ 点击
- 浏览器弹 麦克风权限 → 选 允许
- 选一种 Voice(音色可后改)→ 直接说话,例如:「用三句话解释什么是 RAG」
- 说完等回复播完;想打断 Advanced Voice 可直接开口(以你账号是否开通为准)
过关: 全程没碰键盘,ChatGPT 用 语音 回你;结束点 X 退出 Voice,回到文字界面能看到 同一条对话记录。
我踩过的坑:Main Language 没设 时,中英混说容易被识别成错语言。Help 8459293:右上角 … → Settings → Speech → Main Language 选 中文 或你主要使用的语言,再开 Voice 试一句。
Advanced Voice 和 Standard:别硬追
Advanced Voice FAQ 的口径是:更自然、可打断的 实时语音;是否出现、每日额度 因套餐和地区而异。没有 Advanced 入口时,Standard Voice 照样能用——练口语、口述大纲够用了。别为了「高级」去改账号地区,Help 明确不建议靠改国家字段碰运气。
和 Temporary Chat 的关系:各管各的。Temporary 管「不进历史、不写 Memory」;Voice 管「解放双手」。敏感一次性问题 → 先开 Temporary 再进 Voice;长期项目 → 第 4 讲 Projects。
跟做清单
- [ ] chatgpt.com 找到 耳机图标(不是 dictation 小麦)并成功开 Voice
- [ ] 浏览器 允许麦克风
- [ ] Settings → Speech 设好 Main Language
- [ ] 用 Voice 问一个 30 秒能答完 的问题并听完回复
- [ ] 退出 Voice,确认对话 出现在侧边栏历史(理解 Voice ≠ Temporary)
- [ ] 收藏本讲 FAQ
8400625与 Dictation12168547
