头图

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY,@JLT,@鲍勃

01 有话题的新闻

1、消息称 OpenAI 将推出多模态人工智能数字助理:可语音对话、识别物体

IT 之家 5 月 12 日消息,据 The Information 报道,OpenAI 最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。

报道称,相比于 OpenAI 现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。例如,它可以帮助客服人员“更好地理解来电者的语气语调,判断他们是否在使用讽刺语气”。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。

不过,消息人士也指出,虽然该模型在某些问题解答方面能够超越 GPT-4 Turbo,但仍有可能出现自信地给出错误答案的情况。

IT 之家注意到,开发者 Ananay Arora 发布了一张包含通话相关代码的截图,暗示 OpenAI 可能正在为 ChatGPT 加入打电话的功能。Arora 还发现了一些证据表明 OpenAI 正在配置用于实时音视频通信的服务器。(@IT 之家)

2、研究发现部分 AI 系统已学会「说谎」,未来或演变成更高级欺骗形式

5 月 12 日消息,美国麻省理工学院的研究团队近日发布成果称,部分 AI 已经「学会欺骗人类」,该成果刊登在最新一期的期刊《模式》(Pattern)上。

该团队表示,部分设计为「诚实」且「不会说谎」的 AI 系统,已经发展出令人不安的欺瞒技巧。该研究的第一作者 Peter Park 表示,这些 AI 系统会欺骗线上游戏的真人玩家,或绕过部分网页「我不是机器人」的验证。

「尽管,以上的例子听起来只是细枝末节,但它们暴露出的潜在问题,可能很快就会在现实世界中造成严重后果。」

该团队发现的最为引人注目的例子来自 Meta 公司的 AI 系统 Cicero。据悉,Cicero 原本被设定在一个虚拟外交战略游戏中作为人类玩家的对手,官方曾声称其「很大程度上」诚实且乐于助人,且在玩游戏时「从不故意背刺」人类盟友。研究显示,Cicero 并未公平地去玩游戏。

Peter Park 表示,它已经成为「欺骗大师」,虽然 Meta 成功训练出了它在游戏中获胜的能力,但没有训练出它「诚信获胜」的能力。譬如,在游戏中扮演法国的 Cicero 与人类玩家扮演的德国合谋,欺骗并入侵同为人类玩家的英格兰。Cicero 起初「承诺」会保护英格兰,但同时会偷偷向德国通风报信。(@IT 之家)

3、苹果计划大改 Siri 赶超 ChatGPT 等竞品

据《纽约时报》报道,在高管 Craig Federighi 和 John Giannandrea 体验了几周 ChatGPT 之后,苹果的软件高管决定要对 Siri 进行一次重大升级。

软件高管们认为,ChatGPT 利用生成式人工智能进行诗歌创作、编写计算机代码和解答复杂问题的能力,让 Siri 显得有些落后。

据知情人士透露,苹果计划在 6 月 10 日举行的年度开发者大会上展示其 AI 技术成果。苹果将在那时推出升级版的 Siri,新版 Siri 将融入一种新的生成式 AI ,从而具备更强的对话能力和多功能性。(@爱范儿)

4、2024 年全球 VR 终端出货将突破 810 万台

艾瑞咨询昨日发布 2024 年中国虚拟现实(VR)行业研究报告。报告提及,2023 年全球 VR 终端出货量为 765 万台,其中 Meta、Sony、PICO、DPVR 和 Valve 位居前五。

艾瑞咨询预估,2024 年全球出货将突破 810 万台,并且全球市场将在 2027 年有飞跃式增长。

在报告中,艾瑞咨询还提及,目前 VR 行业的现存卡点主要来自以下两方面:

技术侧:核心芯片、显示屏幕、光学方案、交互技术等均有突破,但 VR 硬件整体性能美中不足,算力、清晰度、产品良率、交互灵活性等仍有提升空间

内容侧:开发技术限制优质内容创作输出,加之内容市场环境成熟度欠缺,优质正版内容难以获得有效保护,反向冲击创作者信心,内容市场闭环待完善(@爱范儿)

5、消息称苹果高管团队将迎来大换血,约翰・特恩斯可能成为苹果下一任 CEO

5 月 12 日消息,据彭博社的马克・古尔曼报道,目前苹果公司的高层管理团队由任职多年的老将组成,随着他们的任期接近尾声,公司高层势必将迎来大换血。虽然约翰・特恩斯 (John Ternus) 可能成为苹果下一任 CEO,但公司还需要为其各个重要部门物色新的领导者。

IT 之家注意到,苹果的执行团队架构紧密,过去十多年来几乎没有变化。而且团队中的许多高层年龄相仿,都与现任 CEO 蒂姆・库克 (Tim Cook) 相差无几。

这意味着苹果面临的挑战不仅仅是找到库克的替代者,许多领导者都可能在同一时期卸任。

彭博社商业周刊此前的一篇文章指出,苹果硬件工程负责人约翰・特恩斯 (John Ternus) 已经成为库克可能的长线接班人,他最近也越来越频繁地出现在公众视野中。上周发布 iPad 新品后,他将于 5 月 18 日在宾夕法尼亚大学的工程学院发表毕业典礼演讲。特恩斯还不到 50 岁,职业生涯还有很大发展空间。报道还称,如果库克近期离职,首席运营官杰夫・威廉姆斯 (Jeff Williams) 也是可能的继任人选。(@IT 之家)

02 有态度的观点

1、OpenAI 奥特曼谈 iPhone:最伟大的技术产品

据国外媒体报道,ChatGPT 之父、OpenAI 首席执行官山姆·奥特曼日前参加了播客节目「All-in Podcast」。在访谈中奥特曼表示,iPhone 是人类历史上制造出的最伟大的技术产品之一。当被问及「语言模型在设备端的情况如何呢」时,奥特曼回答称对这个话题非常感兴趣,并且对计算领域的创新形态充满热情。

「我个人认为,iPhone 是人类历史上制造出的最伟大的技术产品之一。它真的是一款非凡的设备。我之前也提到过,它已经非常出色,以至于想要超越它,我们必须设定一个相当高的标准。」奥特曼说道。值得一提的是,前不久才有报道称,苹果即将与 OpenAI 合作,预计下一代移动操作系统 iOS 18 可能会集成 ChatGPT 的功能。(@快科技)

2、李彦宏:已有 10%的大搜流量通过文心一言模型生成

百度创始人、董事长兼首席执行官李彦宏在一场盛大的内部颁奖活动中,向在场的获奖团队和个人致以热烈的祝贺,并深刻阐述了百度对技术的坚定信仰和对未来的美好展望。李彦宏首先强调,百度始终坚信技术拥有改变世界的力量,并会坚定不移地沿着这条路前行。他表示,虽然创新的过程充满了挑战和不确定性,但百度不会因此放弃,而是会不断尝试、不断突破,直至实现技术的价值。

李彦宏透露,自去年五月开始,百度已经使用大模型重构了所有产品线,如今已有 10%的大搜流量是通过文心一言的模型生成的,每天还有 250 万用户在使用文库的 AI 能力。(@CSDN)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。


素材来源官方媒体/网络新闻


RTE开发者社区
658 声望967 粉丝

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。