斯坦福 AI 团队被曝抄袭中国大模型开源成果；Zoom 创始人谈视频会议未来丨 RTE 开发者日报 Vol.218

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@CY，@JLT，@鲍勃

01 有话题的新闻

1、斯坦福 AI 团队被曝抄袭中国大模型开源成果，作者火速删库，创始人回应：也算国际认可

据钛媒体报道，美国斯坦福大学某 AI 团队在近期发布了一个名为 Llama3V 的 SOTA 开源多模态模型，号称效果比肩 GPT-4V、Gemini Ultra、Claude Opus，尺寸比 GPT4-V 小 100 倍，但训练成本仅需 500 美元。

有网友质疑，该模型抄袭、套壳清华系 AI 公司面壁智能于 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5。面对质疑，Llama3V 团队称，他们只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer（分词器），并宣称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。

而面壁智能团队测试发现，Llama3-V 大模型能识别清华简，其训练数据的采集和标注均由清华 NLP 实验室和面壁智能团队完成，相关数据尚未对外公开。而 Llama3-V 在识别清华简的文字时，结果和 MiniCPM-Llama3-V 2.5 不仅在正确的地方一模一样，在犯错的地方也雷同。

随后，该斯坦福团队成员删除他们在 X 上官宣模型的推文，并将该项目在 Github 和 HuggingFace 上的库一并删除。

而面壁智能联合创始人兼 CEO 李大海朋友圈也对此事做出回应，感慨这是一种「受到国际团队认可的方式」。同时他也呼吁大家共建开放、合作、有信任的社区环境，一起加油合作。（@爱范儿）

2、苹果发出 WWDC24 视频直播邀请：6 月 11 日凌晨 1 点见

6 月 4 日消息，苹果最新通过官方公众号向大家发布了 WWDC24 邀请，将于北京时间 6 月 11 日凌晨 1 点正式开始，号称「猛料加载中」。

据了解，本次大会苹果将发布新一代 iOS 18、iPadOS 18、macOS 15、tvOS 18 以及 watchOS 11、visionOS 2 操作系统。其中，最受消费者关注的还是 iOS 18。爆料称，iOS 18 可能会加入生成式 AI 技术，成为苹果史上升级幅度最大的版本之一。

根据传闻，iOS 18 中的 Siri 会带来大幅提升，能够帮助用户完成更多操作，并且主动提供帮助，此外还能完成一些创作任务。需要注意的是，国内的 AI 服务可能会接入百度文心一言来实现。

知名科技记者 Mark Gurman 曾表示，苹果内部将 iOS 18 视为有史以来最重要的升级。根据 MacRumors 曝光的升级机型名单，iOS 18 将支持 24 款机型升级，与 iOS 17 保持一致。

iPhone 15 系列、iPhone 14 系列、iPhone 13 系列、iPhone 12 系列、iPhone 11 系列、iPhone XS、iPhone XS Max、iPhone XR 以及 iPhone SE 2 和 iPhone SE 3 等设备会支持 iOS 18。（@快科技）

3、特斯拉回应单踏板模式被禁传言：不影响现有的产品和功能

近期，工信部就一项强制性国家标准《乘用车制动系统技术要求及实验方法》公开征求意见。意见中对单踏板提出了具体要求，也就是「在前进挡下通过松开加速踏板实现的制动作用不能使车辆减速至停车」。对此，市场上有声音认为，特斯拉单踏板模式或许将被禁止。

此外，海外一家专注特斯拉的媒体「Tesla Newswire」日前发文爆料称，单踏板「保持」模式将于 2026 年在中国不再可用。对于近期市场上关于特斯拉单踏板模式或被禁止的传言，特斯拉方面向媒体回应称：这项标准目前尚未正式发布和实施，不影响现有的产品和功能。(@CSDN)

4、火狐 Firefox 130 浏览器新特性：本地模型自动生成图片 Alt 文本

6 月 4 日消息，Mozilla 公司于 5 月 31 日发布博文，计划在火狐 Firefox 130 浏览器中测试引入新的功能，使用完全私有、本地运行的 AI 模型自动生成图片的 Alt 文本内容。

Alt 文本，也叫 Alt 标签或 Alt 属性，指的是附加在图像上用来描述图像所显示内容的文本。此文本嵌入在网站的代码中，通常可以通过将光标悬停在图像上查看。
Mozilla 公司正尝试使用基于 Transformer 的多个机器学习模型来描述图片，这些模型非常“小而优”，可以在资源有限的设备上运行。

这些模型虽然无法叫板 GPT-4 Turbo 或 LLaVA，不过其准确性足以在各种硬件设备上提供有价值的见解。（@IT 之家）

02 有态度的观点

1、安全专家称微软 Copilot + 新功能「回顾」存严重安全隐患，数据可被远程窃取

IT 之家 6 月 4 日消息，微软最近发布的 Copilot+ 引发热议，其中一项名为「回顾」（Recall）的 AI 功能更是备受关注。该功能可以自动截取用户电脑屏幕并加以记录，使用户能够像查询记忆一样回顾过去的操作。

然而，一些用户担心这项功能的安全性。用户担心黑客一旦入侵，就能够轻而易举地获取这些记录，暴露用户过去数月的隐私信息。对此，微软坚称所有数据都经过加密处理，但一位网络安全专家却发现了未加密的日志文件，并表示黑客可以远程访问这些信息。

IT 之家注意到，网络安全专家凯文・博蒙特（Kevin Beaumont）在社交平台上指出，经过调查，他发现「回顾」功能的日志系统仅仅是一个 SQLite 数据库，并称该功能的存在「让网络安全倒退十年」。他建议用户在 Copilot+ 上线后立即禁用「回顾」功能，以防止数据泄露。（@IT 之家）

2、Zoom 创始人谈视频会议未来：数字人「代劳」参会，本人可抽出时间陪伴家人

IT 之家 6 月 3 日消息，视频会议平台 Zoom 创始人袁征（Eric Yuan）日前接受外媒 The Verge 采访，谈到了视频会议这一新兴会议形式的未来发展。

袁征先前在思科工作，后续创办了 Zoom，并意识到有机会使视频会议更加简单易用。而在当下，袁征希望 Zoom「不仅仅」是一个视频会议平台，而是在企业软件领域与微软、谷歌一较高下，力图把文档、邮件和其他生产力工具做得像「聊天平台」一样。

现如今各行各业都在拥抱 AI，Zoom 也不例外，并在 AI 领域投入了巨资。袁征表示，AI 在工作中的一大好处，就是所有人都能创造一个「数字孪生」—— 其本质上是本人的一个「深伪」化身。这个「数字孪生」可以代表用户去参加 Zoom 视频会议，甚至在用户自己把时间花在更重要的事情（例如陪伴家人）时，代替自己做出决策。

袁征进一步补充说，实现这一目标的前提是用户可以控制所有的数字孪生。某些情况下，用户的多个数字孪生会根据训练的内容而展现出不同的特征。例如，一个数字孪生更像销售专家、另一个数字孪生更像资深工程师。「这就是人工智能充满不确定性的原因，但在现实中，它一定会实现。」

据 IT 之家此前报道，Zoom 去年已经在服务条款中明确，在未经用户许可的情况下，不会利用用户的数据，来培训生成式 AI。（@IT 之家）

写在最后：

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

斯坦福 AI 团队被曝抄袭中国大模型开源成果；Zoom 创始人谈视频会议未来丨 RTE 开发者日报 Vol.218

01 有话题的新闻

02 有态度的观点

RTE开发者社区

引用和评论

扎克伯格：AR 眼镜会是未来的手机，VR 则是未来的电视；Manus AI 融资 7500 万美元，开放免费使用丨日报

大模型中的Token究竟是什么？从原理到作用深度解析

Open WebUI：开源AI交互平台的全面解析

一文掌握 MCP 上下文协议：从理论到实践

MySQL × 向量数据库：大模型时代的黄金组合实战指南

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

有了DeepSeek等AI大模型，人人都能当医生吗？