ChatGPT语音模式使用教程:走路也能聊的Voice Mode设置与语言调整




学会了 Temporary Chat——不让对话进历史。但走路、做饭、练口语时,我反而更常用 Voice 语音模式:不用打字,直接和 ChatGPT 说话。很多人第一次点错 输入框旁的小麦克风——那是 dictation(语音转文字),录完还得自己点发送;Voice Mode 才是 整段语音对话

 

本节在系列里讲什么

ChatGPT 使用指南 共 10 讲。本讲只练 Voice Mode:怎么开、和 dictation 差在哪、语言怎么设。生成图片从第 7 讲起。

 

官方文档链接(建议收藏)

  • Help Center:https://help.openai.com
  • 本讲 · Voice Mode FAQ:https://help.openai.com/en/articles/8400625-voice-mode-faq
  • Advanced Voice FAQ:https://help.openai.com/en/articles/9617427-advanced-voice-mode-faq
  • Voice Dictation FAQ(别和 Voice Mode 混):https://help.openai.com/en/articles/12168547-voice-dictation-faq
  • 语言识别 · Main Language:https://help.openai.com/en/articles/8459293-why-does-the-voice-input-detect-a-different-language-from-the-one-im-speaking
  • 第 5 讲 · Temporary Chat:https://help.openai.com/en/articles/8914046-temporary-chat-faq

 

先把两个「麦克风」分清楚

OpenAI Help 把 dictation 和 Voice Mode 分开写,我习惯记成:

入口 你在干什么 典型场景
输入框 麦克风 录音 → 转文字 → 你再点发送 长段落口述、不想手打
耳机 / 波形图标 进入 语音对话界面,边说边听回复 走路 brainstorm、练口语

Dictation FAQ 写:录音会随 聊天历史 保留(删聊天后约 30 天内删音频);Voice Mode FAQ 讲的是 另一套语音会话能力。所以我查敏感资料仍用第 5 讲的 Temporary Chat;Voice 里聊的内容 默认会进普通对话历史——别在 Voice 里念身份证号还指望「不留痕」。

 

浏览器跟做:开 Voice Mode

Web 端(与 chatgpt.com/features/voice 一致):

  1. 打开 chatgpt.com,进任意 普通对话(Temporary Chat 也能开 Voice,但隐私边界见上)
  2. 看输入栏右侧 耳机图标(不是输入框里的小麦)→ 点击
  3. 浏览器弹 麦克风权限 → 选 允许
  4. 选一种 Voice(音色可后改)→ 直接说话,例如:「用三句话解释什么是 RAG」
  5. 说完等回复播完;想打断 Advanced Voice 可直接开口(以你账号是否开通为准)

过关: 全程没碰键盘,ChatGPT 用 语音 回你;结束点 X 退出 Voice,回到文字界面能看到 同一条对话记录

我踩过的坑:Main Language 没设 时,中英混说容易被识别成错语言。Help 8459293:右上角 … → Settings → Speech → Main Language 选 中文 或你主要使用的语言,再开 Voice 试一句。

 

Advanced Voice 和 Standard:别硬追

Advanced Voice FAQ 的口径是:更自然、可打断的 实时语音;是否出现、每日额度 因套餐和地区而异。没有 Advanced 入口时,Standard Voice 照样能用——练口语、口述大纲够用了。别为了「高级」去改账号地区,Help 明确不建议靠改国家字段碰运气。

和 Temporary Chat 的关系:各管各的。Temporary 管「不进历史、不写 Memory」;Voice 管「解放双手」。敏感一次性问题 → 先开 Temporary 再进 Voice;长期项目 → 第 4 讲 Projects。

 

跟做清单

  • [ ] chatgpt.com 找到 耳机图标(不是 dictation 小麦)并成功开 Voice
  • [ ] 浏览器 允许麦克风
  • [ ] Settings → Speech 设好 Main Language
  • [ ] 用 Voice 问一个 30 秒能答完 的问题并听完回复
  • [ ] 退出 Voice,确认对话 出现在侧边栏历史(理解 Voice ≠ Temporary)
  • [ ] 收藏本讲 FAQ 8400625 与 Dictation 12168547