开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@CY,@JLT
01 有话题的新闻
1、多家中国车企宣布将搭载英伟达最新车载芯片
在英伟达 GTC 2024 大会上,英伟达与中国智能电动汽车厂商比亚迪、小鹏汽车以及广汽旗下的昊铂品牌达成合作。未来,这些车企将采用英伟达 Drive Thor 芯片。此前,理想汽车、极氪也曾宣布,将使用英伟达的 Drive Thor 芯片。
该芯片拥有高达 1000 TFLOPS 的强大算力,该芯片具备高度自动化和自动驾驶功能,并且全部集成在单一的中央平台上。英伟达汽车部副总裁 Danny Shapiro 表示:「这是英伟达真正端到端地应用广泛汽车应用中的加速计算和可视化技术。」
比亚迪将使用英伟达 Drive Thor 芯片打造比亚迪下一代新能源汽车,以及采用其 AI 基础设施进行基于云的 AI 开发和训练。
英伟达在中国有坚实的客户群体,其约有五分之一的收入来自中国。(@车东西)
2、Altman 曝全新 GPT-5 细节
近日,OpenAI 创始人 Sam Altman 在硅谷出席一个活动时,现场透露了关于 GPT-5 的更多细节和进展。
他表示,GPT-5 的性能提升的程度将超出预期,并且 GPT「没有局限」,只要投入足够的计算资源,构建超越人类的 AGI 并不困难。
Altman 同时表示,目前除了「构建通用人工智能」之外,他对于其他技术没有任何兴趣,包括区块链和生物技术。他认为,在达到 AGI 之后,可能算力就不是一个特别大的问题了。AI 几乎可以解决一切和发展有关的问题。从长远来看,他认为人类「需要一个能够用更少的数据学习更多东西的模型」。(@新智元)
3、欧盟被曝正考虑是否跟随美国审查成熟制程芯片对华依赖风险
欧盟正考虑启动正式审查,以评估欧洲企业对来自中国的成熟制程或低端芯片的依赖程度。
报道声称,这意味着欧盟将加入美国行列,与美国一道提出这种对华依赖对国家安全和全球供应链构成的“潜在风险”。(@环球网)
4、小米发布 2023 年财报,汽车业务也有了新目标
3 月 19 日,小米集团发布 2023 年业绩公告。财报显示,2023 年,小米集团总收入为 2710 亿元,同比降低 3.2%;经调整净利润同比增长 126.3% 至 193 亿元。
三大业务板块中,智能手机分部收入由去年同期的 1672 亿元减少 5.8% 至 1575 亿元,降幅接近百亿。小米称,主要由于智能手机出货量及 ASP(平均售价)下降。ASP 下降的原因,主要是由于 2023 上半年集团增强了境外市场清理存货的力度,以及 2023 年下半年 ASP 较低的新兴市场出货量增加。
当天,小米创始人雷军宣布小米汽车超级工厂正式揭幕。财报显示,2023 年年度,小米智能汽车等创新业务费用增长至 67 亿元(不含与智能电动汽车等创新业务相关的股票薪酬费用 8 亿元)。其中,第四季度为 24 亿元(不含与智能电动汽车等创新业务相关的股票薪酬费用 2 亿元)。
对于智能汽车业务的目标,小米集团总裁卢伟冰在财报电话会上表示,集团希望小米 SU7 在纯电豪华轿车领域做到前三名。(@第一财经)
5、苹果称其完全遵守欧盟 DMA 法规,相比开发者的感受更注重用户体验
3 月 19 日消息,随着 iOS 17.4 的发布,苹果推出了许多举措来使其符合欧盟《数字市场法案》(DMA) 的要求,包括允许使用替代应用商店、为开发者提供新的商业条款以及支持第三方浏览器引擎等。不过,苹果新政策受到了 Meta、Epic 和 Spotify 等多个大型公司的批评,他们认为苹果是在耍小聪明,是“恶意合规”。
据外媒报道,苹果律师 Kyle Andeer 在周一的欧盟听证会上对这一系列改变进行了辩护,并解释了为什么他们认为自己已经符合 DMA 的规定。他还提到,苹果更多地是从用户体验的角度去考虑这些变化,而不是开发者的角度(@IT 之家)
6、Stability AI 发布 Stable Video 3D
AI 创业公司 Stability AI 发布了 Stable Video 3D,输入一个对象的静态照片生成该对象的 3D 模型。Stable Video 3D 有两个版本:SV3D_u 和 SV3D_p,其中 SV3D_u 输入单幅图像生成轨道视频,无需相机调节;SV3D_p 组合了单幅图像和轨道视图,允许沿着指定相机路径创建 3D 视频。Stable Video 3D 的商业使用需要付费,非商业使用可在 Hugging Face 上下载模型权重(9.37GB)。(@CSDN)
7、谷歌推出多模态 VLOGGER AI:让静态肖像图动起来“说话”
谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。VLOGGER AI 是一种适用于虚拟肖像的多模态 Diffusion 模型,使用 MENTOR 数据库进行训练,该数据库中包含超过 80 万名人物肖像,以及累计超过 2200 小时的影片,从而让 VLOGGER 生成不同种族、不同年龄、不同穿着、不同姿势的肖像影片。
研究人员表示:“和此前的多模态相比,VLOGGER 的优势在于不需要对每个人进行训练,不依赖于人脸检测和裁剪,可以生成完整的图像(而不仅仅是人脸或嘴唇),并且考虑了广泛的场景(例如可见躯干或不同的主体身份),这些对于正确合成交流的人类至关重要”。(@CSDN)
02 有态度的观点
1、AI 科学家李飞飞:不管那些技术词汇多陌生,我也恳求你在 AI 时代中有一个角色
英伟达 GTC 大会上,AI 科学家李飞飞对话英伟达首席科学家 Bill Dally,如果说黄仁勋与 OpenAI 首席科学家 Illya 进行的是一场对技术未来的漫谈,那今年这场炉边谈话就是李飞飞对人类未来的呼吁。
AI 是一个工具。它是一个需要一些数学和计算来实现的工具。但归根结底,人类不仅是工具的创造者,我们也是如何使用工具的决策者;我们是工具应用的创造者,我们也是工具的用户;我们是决定如何管理工具以及管理想要使用工具的人的选民。所以在参与 AI 方面有很多公民的可能性。我特别希望年轻人,那些热爱艺术、热爱社区、热爱法律、热爱医学、热爱化学的人,无论你的兴趣是什么,都能以负责任的态度拥抱这项技术,你们实际上可以为让它变得更好、更好地使用它而有所作为。这真的是我对每个人的恳求:你们在 AI 发展中有一个角色,请加入我们,让它变得更好。
在整场对谈,李飞飞都用一种很不同的思考 AI 的视角,来给这个 AI 时代失语的普通人一个声音。(@腾讯科技)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。