AI 笔面助手/网页端体验/音频与权限问题

音频与权限问题

依据 WebVoiceAssistant 的采集流程说明权限链路、共享链路与降级行为。

链路说明

  • 启动顺序固定:先建会话,再请求麦克风,最后在开启“系统音频”时发起屏幕共享音频。
  • 系统音频来源不是独立设备,而是浏览器共享流:getDisplayMedia({ video: true, audio: true })
  • “开了系统音频但听不到面试官”优先定位共享弹窗勾选状态,而不是先怀疑识别服务。

预期行为(非故障)

  • 共享弹窗未勾选“共享系统音频/标签页音频”时,前端会自动降级为仅麦克风采集。
  • 共享对象无音轨时,前端会关闭系统音频并提示“未开启系统音频,将只采集麦克风”。
  • 会话中途补接系统音频受限:当前会话未建立 interviewer 通道时,会提示“请停止后重新开始”。
  • 关闭输入源开关后,草稿被清空属于保护逻辑,目的是避免旧草稿误落地。

标准排查步骤

  1. 检查浏览器站点权限:麦克风是否允许。
  2. 检查系统权限:麦克风与屏幕录制是否允许。
  3. 启动会话并在共享弹窗勾选“共享系统音频/标签页音频”。
  4. 若系统音频仍缺失,停止会话并完整重启,不在会话中反复切换开关。

验收标准

  • 10 秒系统音频测试:出现面试官草稿或落地文本。
  • 10 秒麦克风测试:本人语音可连续落地。
  • 两路都稳定后再进入正式面试。

系统音频开关只表示“发起共享流程”。是否真正接入面试官语音,以共享弹窗勾选结果和实际音轨为准。