音频与权限问题
依据 WebVoiceAssistant 的采集流程说明权限链路、共享链路与降级行为。
链路说明
- 启动顺序固定:先建会话,再请求麦克风,最后在开启“系统音频”时发起屏幕共享音频。
- 系统音频来源不是独立设备,而是浏览器共享流:
getDisplayMedia({ video: true, audio: true })。 - “开了系统音频但听不到面试官”优先定位共享弹窗勾选状态,而不是先怀疑识别服务。
预期行为(非故障)
- 共享弹窗未勾选“共享系统音频/标签页音频”时,前端会自动降级为仅麦克风采集。
- 共享对象无音轨时,前端会关闭系统音频并提示“未开启系统音频,将只采集麦克风”。
- 会话中途补接系统音频受限:当前会话未建立 interviewer 通道时,会提示“请停止后重新开始”。
- 关闭输入源开关后,草稿被清空属于保护逻辑,目的是避免旧草稿误落地。
标准排查步骤
- 检查浏览器站点权限:麦克风是否允许。
- 检查系统权限:麦克风与屏幕录制是否允许。
- 启动会话并在共享弹窗勾选“共享系统音频/标签页音频”。
- 若系统音频仍缺失,停止会话并完整重启,不在会话中反复切换开关。
验收标准
- 10 秒系统音频测试:出现面试官草稿或落地文本。
- 10 秒麦克风测试:本人语音可连续落地。
- 两路都稳定后再进入正式面试。