OpenAI突然更新GPT-4o推高级语音版问题秒回答网友玩疯了_杏彩体育官网·(中国)·登录入口-ios/安卓/手机版app下载

咨询电话：400-185-5889

— 新闻中心 —

杏彩体育官网登录入口下载手机版

全国免费客服电话 400-185-5889

杏彩体育官网·(中国)·登录入口-ios/安卓/手机版app下载

邮箱：hobbm@www.mdzlsb.com

手机：15533551556 15533551667 15533551889 15533551998

电话：400-185-5889

地址：河北省唐山市玉田县北环工业园

您的位置：首页 > 新闻中心

新闻中心

杏彩体育官网入口:OpenAI突然更新GPT-4o推高级语音版问题秒回答网友玩疯了

来源：杏彩体育官网入口网址作者：杏彩体育官网登录入口下载手机版 2024-12-23 06:54:49

　　当时，OpenAI 宣称该功能将在几周内陆续向免费和付费用户推出。但发布没几天，OpenAI 就因演示中的 ChatGPT 声音，与《复仇者联盟》系列电影中黑寡妇扮演者、被影迷称为寡姐的斯嘉丽 · 约翰逊（Scarlett Johansson）声线过于相似，而遭到斯嘉丽本人的控诉和网友的强烈反对。

　　高级语音模式的发布日期也因此被推迟。尽管 OpenAI 坚称 ChatGPT 并没有模仿斯嘉丽的声音，但该声线后来还是被删除了。

　　基于 GPT-4o 的高级语音模式目前仅向小部分 ChatGPT Plus 用户推出，可提供更自然的实时对话，允许用户随时打断，并能感知和响应用户情绪。

　　参与此 Alpha 测试的用户将收到一封包含说明的电子邮件，并在其 ChatGPT 手机端 App 中收到通知。OpenAI 称，后续将继续滚动添加更多用户，并计划在秋季让每一个 Plus 订阅用户上都能使用。

　　ChatGPT 的高级语音模式于今年 5 月发布，其基于 OpenAI 全新旗舰模型 GPT-4o，可以进行语音聊天和实时视频交互，比如通过视频影像理解线性方程、通过人的表情和语调理解并判断出人的情绪等。

　　OpenAI 称，自首次发布以来，团队一直致力于加强语音对线多名外部红队成员一起测试了语音功能。

　　为了保护隐私，OpenAI 在训练模型时只用四种预设的声音说话，并构建了相应的系统来屏蔽与不同的输出，还采取了防护措施来屏蔽对暴力或版权内容的请求。

　　OpenAI 计划在 8 月初，分享一份关于 GPT-4o 的功能、局限性和安全评估的详细报告。

　　艺术家 Manuel Sainsily 打开摄像头，一边实时拍摄自己的刚养的小猫和为其布置的环境，一边询问 ChatGPT 关于喂养的意见。

　　ChatGPT 的回应基本没有任何延迟，先是用非常宠爱的语气称赞了猫咪的可爱，随后在询问了更多信息后安慰 Sainsily，告诉他不用担心。Sainsily 感慨道：这感觉就像与一位知识渊博的朋友进行视频通话。

　　网友 Bergara 在社交平台 Reddit 分享道，ChatGPT 拒绝了他所有的唱歌请求，也不愿意改变声线。当他让 ChatGPT 以不同的方式和情绪背诵一首诗歌时成功了，但要求它笑着背诵这首诗时，它拒绝了。

　　例如， Bergara 称自己正在练习法语，让 ChatGPT 充当语言教练，询问其关于发音的意见。

　　针对 Bergara 的单词发音，ChatGPT 详细地给出了关于重音、尾音等的建议，并做了示范。同时其在教学风格上非常鼓励式教育，毫不吝啬地夸奖 Bergara 的发音，情绪价值直接拉满。

　　Bergara 又让 ChaGPT 分别用害羞、生气的语气讲关于啤酒的笑话。ChatGPT 对害羞的理解是用气声发音，在表达生气时则提高了自己的分贝。

　　Bergara 称，到目前为止的测试里，ChatGPT 表现出的样子和 OpenAI 所展示的差不多，但拒绝率似乎有点高，他推测可能是出于安全原因。

　　例如，当 Bergara 要求 ChatGPT 用歌声讲一个关于机器人和爱的故事，它称自己可以讲故事，但只能用平常说话的语气。

　　在 ChatGPT 讲故事的过程中，Bergara 多次打断并要求它加入更多感情。ChatGPT 照做了，其语气变得更加缓慢和生动。

　　Squad 联合创始人、首席技术官 Ethan Sutin 让 ChatGPT模仿了各种各样的猫叫。不得不说这猫叫有些魔性，但似乎还挺真实的，因为我家猫被吸引过来了

　　ChatGPT 似乎还具备音乐演奏的能力。Sutin 让其演奏一个 C 小调，有没有懂乐理的读者朋友来听一下是否准确？

　　网友 Cristiano Giardina 让 ChatGPT 扮演起了足球比赛评论员。他分享了试用高级语音模式的一些初步印象：速度非常快，总是会产生有趣的结果，在说其他语言时总是带有美国口音。

　　网友 Kesku 让 ChatGPT 说一种不存在的语言，然后解释这种语言是如何运作的。ChatGPT 创造了一种基于声音的语言 Glimnar，听起来有点像吟唱。

　　尽管现在用上 ChatGPT 高级语音模式的用户还是少数，但随着其推送范围的扩大，也许我们能看到更多有趣的玩法和体验。

　　AI 在语音、视频方面，正在因为其充当欺诈工具的能力受到审查。尽管 OpenAI 的语音模式目前不允许生成新的声线或语音克隆，但该模式仍然可能会给人带来混淆。

　　在春季更新后的几个月里，OpenAI 发布了一系列关于安全性和 AI 模型对齐的新论文。在此之前，其超级对齐团队已经解散，一些前任和现任员工批评其将重点转移到发布新产品而不是安全性上。目前来看，高级语音模式的推出放缓似乎是在向用户、监管机构和立法者表明 OpenAI 对安全的重视。

标签：

上一篇:人形机器人的万亿市场中国竞争力如何？

下一篇:临潼在建项目：西北最大粮库、青啤全国第四大工厂、中国标准工业集团新厂区