在 OpenAI 春季发布会中该公司演示了 ChatGPT 的高级语音模式,这种语音模式是实时交互的,例如在 AI 进行说话时用户可以打断并继续补充内容,AI 也可以感知幽默或者讽刺等并做出回应。
与此前的 ChatGPT 语音功能最大的区别在于,此前的语音交互是先将语音转换为文本内容再发送给 AI,然后生成回复后 AI 再将其朗读出来,这个过程会增加交互的延迟时间。
而高级语音模式不需要进行转换 (只是用户看不到转换过程),整个对话过程非常流畅并且交互延迟也比较低,高级语言模式也支持多模态可以调用摄像头实时识别内容。
目前只有少部分已经开通 ChatGPT Plus 的订阅用户可以受到邀请,OpenAI 将逐渐扩大该功能的使用范围,预计到秋季大部分 ChatGPT Plus 订阅用户都可以使用高级语音模式。
值得注意的是 OpenAI 还强调自从演示高级语音模式后,该公司一直在努力提高语音对话的安全性和质量,高级语音模式预设了四种声音,还添加了防止模仿名人声音的限制。
同时高级语音模式也同样存在各种安全限制,例如安全围栏功能会阻止对暴力或者版权内容的请求,即便用户进行诱导,AI 可能也会拒绝输出此类内容。
已经开通 ChatGPT Plus 的用户请检查自己的邮箱,如果收到高级语言功能的邀请,OpenAI 会发送一封电子邮件进行说明。
最新评论
苹果如果不支持微信,那它就是要退出中国市场了!
自己花钱买的座位,凭什么不能换?
不得不说蓝心妍很漂亮,我喜欢!
人间胸器
去了美颜滤镜,估计就是大妈了!
期待,不过感觉自己可能用不上了!
天涯不是彻底关闭了吗?
感觉长想一般般!