DeepSeek缝合Claude,比单用R1/o1效果都好!GitHub揽星3k

2 月 14 日
阅读 3 分钟
879
让思考,缝合怪玩法火了。原因无它:比单独使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模型的效果更好。先来看一段VCR:视频链接:[链接]\_CN再来看一个测评结果:在代码编辑基准Polyglot Benchmark上,缝合模型效果小超o1-high和R1一头。在这个测试中,R1扮演架构师,描述如何解决代码问题。而Claude扮演程序员,按...

DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制

2 月 14 日
阅读 5 分钟
639
最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了??Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。这些谜题特点是很好理解,不需要专业知识就能看懂,然鹅解决起来却没那么容易。举个栗子:想一个熟悉的五个字母、两个...

达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩

2 月 14 日
阅读 5 分钟
897
7B大小的视频理解模型中的新SOTA,来了!它就是由达摩院出品的Video LLaMA 3,以图像为中心构建的新一代多模态视频-语言模型。在通用视频理解、时间推理和长视频理解三个核心维度进行评估的过程中,VideoLLaMA 3均取得优异成绩,超越多数基线模型。不仅如此,适用于端侧的2B大小的Video LLaMA 3,在图像理解上的表现也是...

百度决定背叛闭源大模型,李彦宏重新拥抱开源

2 月 14 日
阅读 2 分钟
922
继昨天决定免费之后,百度刚刚又发布一则重磅消息——下一代文心模型,决定开源!而且官宣内容只有一句话(字少事大的感觉):我们将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。从收费到免费,从闭源到开源……嗯,DeepSeek带来的冲击着实是有亿点点大。从闭源到开源的文心一言回顾文心一言的发展历...

昆仑万维发布Matrix-Zero世界模型,开启空间智能新时代

2 月 14 日
阅读 4 分钟
865
2月14日,昆仑万维正式推出Matrix-Zero世界模型,成为中国第一家同时推出3D场景生成、可交互视频生成模型的探索空间智能的企业。Matrix-Zero世界模型包含两款子模型:013D场景生成大模型昆仑万维自研3D场景生成大模型,支持将用户输入的图片转化为可自由探索的真实合理的3D场景,比World Labs生成场景的探索范围更大更自...

谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧

2 月 13 日
阅读 3 分钟
803
史上最大规模视觉语言数据集:1000亿图像-文本对!什么概念?较此前纪录扩大10倍。这就是由谷歌推出的最新数据集WebLI-100B。它进一步证明,数据Scaling Law还远没有到上限。在英文世界之外的多元文化、多语言维度,1000亿规模数据集能更好覆盖长尾场景,由此带来明显性能提升。这意味着,想要构建更加多元的多模态大模...

Karpathy大神问懵DeepSeek!一个emoji竟藏了53个Token,思考10分钟没解释出来

2 月 13 日
阅读 3 分钟
775
注意看,这个(笑脸emoji)竟然占了53个token!Karpathy大神又带来他的新实验新发现了,结果直接问懵DeepSeek和ChatGPT。思考过程be like:DeepSeek硬是思考了十分钟也还是没有答上来,觉得要是“lol”这个答案就太简单了。Karpathy表示:但其实就是这么简单。随后他进一步解释了这背后的原因——提示词注入。将一些信息注入...

智驾一标配,比亚迪市值破万亿

2 月 13 日
阅读 3 分钟
858
“开天眼”的比亚迪,市值再破万亿。短短5天,比亚迪的股价上涨超20%,市值暴涨近2000亿。回溯第一次市值破万亿,是在2022年6月。那时的比亚迪,毅然决定All in新能源,带着DM4.0和刀片电池,从此与燃油车割袍,刚成为唯一月销破10万的车企。这次时隔三年,再次站上万亿市值高度,比亚迪甩出三张王炸:全系高阶智驾彻底掀...

全平台搭载旭日5!科沃斯GOAT智能割草机器人全新系列正式开售

2 月 13 日
阅读 2 分钟
754
近日,科沃斯全新发布的GOAT A Series 和 GOAT O Series割草机器人,将在多国市场正式上市发售。作为业界最强的割草机器人产品之一,GOAT致力为割草机带来基于机器人视觉的专业定位解决方案。GOAT全新系列产品全平台搭载地瓜机器人全新推出的旭日5智能计算芯片,具备10 TOPs 算力,拥有丰富的异构计算资源,可支持机器人...

文心一言全面免费了,深度搜索功能同时上线,第一手实测在此

2 月 13 日
阅读 5 分钟
861
所有PC端和APP端用户均可体验文心系列最新模型。文心一言将于4月1日零时起,全面免费! 所有PC端和APP端用户均可体验文心系列最新模型。

腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态

2 月 13 日
阅读 4 分钟
1k
刚刚,腾讯主力AI应用「元宝」宣布接入Deepseek-R1满血版!现在打开腾讯元宝,它已经可以在模型选择框中,自由切换混元模型和满血版DeepSeek-R1。而且切换到满血版DeepSeek的腾讯元宝,支持联网搜索。这下,它已经是——支持双模型+可联网搜索+整合微信公众号、视频号等腾讯生态信息源的钮祜禄·腾讯元宝了!值得注意的是,...

你的新Model Y都有这些全新设计,七座版也被官方确认了

2 月 13 日
阅读 3 分钟
858
新款Model Y做了哪些改动?现在有官方的完整介绍了。特斯拉车辆工程副总裁现身说法,透露为了FSD,Model Y重新设计了一个关键硬件。对此,网友激动直呼:这可比激光雷达对FSD有用多了。改版的更多细节,也随“揭秘”一同曝光。就连推出Model Y七座版,也敲定时间了。“比激光雷达更有用的硬件”变化来自Model Y的侧中继摄像...

比尔盖茨自述曾是熊孩子:16岁徒步数百英里,边走脑中边写BASIC代码

2 月 13 日
阅读 5 分钟
675
步入70岁之际,比尔·盖茨终于出版了自己人生中的首部自传《源代码》。不同于以往的商业发展视角,无关对微软成就的宏大叙事,在这本书里,比尔·盖茨自己的成长历程和创业故事一一铺陈开:生在一个优秀的家庭,撞上历史性技术变革与乐观情绪弥漫的时代,自己在个人电脑革命方兴未艾之时步入成年……过去十几年,比尔·盖茨一...

本想去谷歌捞一笔就跑,却成了改变AI历史的人|Transformer作者对话Jeff Dean

2 月 13 日
阅读 6 分钟
882
现任首席科学家Jeff Dean、出走又回归的Transformer作者Noam Shazeer,与知名播客主持人Dwarkesh Patel展开对谈。

听力熊Teeni.AI全面接入DeepSeek大模型,顶尖科学家张驰加盟强化技术壁垒

2 月 13 日
阅读 2 分钟
902
近日,国内青少年智能硬件头部品牌听力熊 (Teeni.AI)宣布两大重要进展:全面接入DeepSeek大模型,并引入西湖大学AGI实验室创始人、AI科学家张驰出任首席科学家兼CTO。

GPT-4.5马上发布,GPT-5免费畅聊!奥特曼剧透大动作,网友:让DeepSeek整破防了

2 月 13 日
阅读 5 分钟
1k
GPT-4.5将在未来几个周/月内发布!GPT-5也快了,且是免费用户也能无限聊的那种!这是奥特曼刚刚在最新推文中放出的豪言。这篇推文短短216个单词,但包含了巨大的信息量:GPT-4.5/5将很快陆续发布,ChatGPT免费用户能享受GPT-5的无限制聊天;几周/月内发布的GPT-4.5,是OpenAI最后一个非推理模型;o3不会作为独立模型发布...

奥特曼再谈DeepSeek:每天醒来都有压力

2 月 12 日
阅读 3 分钟
895
关乎当红炸子鸡DeepSeek,奥特曼最新观点出炉:对DeepSeek的出现并不意外,而且类似的情况会越来越多。这就是奥特曼在最新一期《泰晤士报》科技播客节目中所提及的内容之一。并且在被问及是否担心OpenAI会成为AI界的Napster(首个P2P音乐共享平台,后因商业压力以失败告终)时,他表示:唯一不让这种事发生的方法就是每...

o3拿下IOI 2024金牌!新论文公布RL秘诀:AI自己设计测试时推理策略,无需人类干预

2 月 12 日
阅读 6 分钟
921
刚刚,OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告,论文中放出了OpenAI家推理模型三兄弟在IOI和CodeForce上的具体成绩。

奥特曼公开回怼马斯克,OpenAI董事会成员:说要收购,没收到报价啊?

2 月 12 日
阅读 3 分钟
675
马斯克此举只是压制竞争的小伎俩,我希望他能通过打造更好的产品来竞争;可能他的一生都处于不安全状态,我为这个人感到难过…我不认为他是个快乐的人。OpenAI不打算出售。

免费!满血版DeepSeek丝滑畅玩,低门槛实现671B-R1/V3自由

2 月 12 日
阅读 2 分钟
798
想快速顺畅上手DeepSeek还不踩坑?“真·满血DeepSeek-671B-R1/V3解决方案”来了!它能解决的问题包括:服务器总繁忙充了钱却被残血模型欺骗费力拉新,遇上代金券失效背刺不懂代码,不会使用API接口模型不能联网查询实时信息数据隐私要求高,不想上传外网潞晨云官方现在提供以下服务:免费通道:不用拉新、不计代金券、不用...

4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛

2 月 12 日
阅读 3 分钟
796
而市面上所谓“本地部署”方案,多为参数量缩水90%的蒸馏版,背后原因是671B参数的MoE架构对显存要求极高——即便用8卡A100也难以负荷。因此,想在本地小规模硬件上跑真正的DeepSeek-R1,被认为基本不可能。

啊?7B的DeepSeek反超R1满血版,上海AI Lab周伯文团队新成果

2 月 12 日
阅读 3 分钟
754
除此之外,0.5B模型超过GPT-4o,1.5B的DeepSeek蒸馏Qwen超过o1-mini和o1-preview,3B的Llama超过405B的Llama……

推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

2 月 12 日
阅读 4 分钟
834
字节出了个全新架构,把推理成本给狠狠地打了下去!有多狠?推理速度相比MoE架构提升2-6倍,推理成本最高可降低83%。这个全新的稀疏模型架构叫做UltraMem,有效地解决了目前主流的MoE架构和PKM架构所存在的局限性。例如MoE在做推理时,较小的batch size会激活全部专家,导致访存急剧上升,推理延迟增加;而PKM虽然减少了...

微信小程序如何调用 DeepSeek?腾讯云开发:最少仅需3行代码

2 月 12 日
阅读 6 分钟
1.4k
2月11日,腾讯云开发宣布能力上新,开发者能够基于最新的小程序基础库,最少仅需输入3行代码,就可以将满血版 DeepSeek 大模型能力接入到小程序中,快速实现智能对话、文本生成等功能。其中,云开发新用户首月套餐免费,并享有100万token。

马蜂窝AI智能体成首个接入DeepSeek的旅游行业应用

2 月 12 日
阅读 2 分钟
679
随着DeepSeek的爆火,其技术能力迅速被引入各个领域,近日,马蜂窝宣布其自研的AI智能应用正式接入DeepSeek大模型,首阶段将优先应用于已上线发布的“AI游贵州”、“AI游黔西南”、“AI游西江” 省市景区三级AI应用生态,进一步优化和提升贵州旅游服务的智能化水平。

北京市级政府引导基金领投!玻色量子获A+轮融资

2 月 12 日
阅读 2 分钟
781
近日,量子计算产业链长企业北京玻色量子科技有限公司(以下简称“玻色量子”)完成A+轮融资。此次融资由北工投资管理的北京市级政府引导基金——北京高精尖产业发展投资基金(有限合伙)(简称“高精尖实体化基金”)领投。

只需一句话,AI调用多个应用为你打工!三星S25系列国行版发布,AI功能大升级

2 月 11 日
阅读 3 分钟
792
刚刚,三星S25系列(S25、S25+、S25 Ultra)国行版正式亮相!内置的Galaxy AI功能也一同升级,能够跨越APP的界限,调用不同应用来完成操作。并且部分AI功能支持在端侧运行,隐私安全更有保证。当然了,想在端侧流畅地运行AI模型,必然离不开算力的支持,再通俗些,芯片要足够强才行。S25系列采用了3nm的高通骁龙8至尊版...

不用跟着挤DeepSeek官方了!这个神器让你零门槛拥有私人助手

2 月 11 日
阅读 6 分钟
856
现在,人人都可以构建DeepSeek智能体了!只需简单几步,就可以丝滑使用满血版,不仅稳定,还没有任何额度限制。要知道,这段时间以来DeepSeek太火,用着用着就会看到「服务器繁忙,请稍后再试」。官方服务器不堪重负,而API优惠也已经结束,恢复原价。就在今天,支付宝百宝箱宣布接入DeepSeek,面向所有用户上线DeepSeek...

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

2 月 11 日
阅读 2 分钟
830
开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线:抛弃长思维链和人类的语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。例如问题:Claire每天早餐都会做一个3个鸡蛋的煎蛋卷。她在4周内会吃多少个鸡蛋?从新模型Huginn的思考轨迹可视化中,可以看到对数字3...

本科生颠覆姚期智40年前猜想!意外发现新型哈希表,数据搜索速度突破理论上限

2 月 11 日
阅读 3 分钟
856
姚期智40年前猜想被本科生意外颠覆!00后本科生安德鲁·克拉皮文(Andrew Krapivin,简称小克)发现了一种新型哈希表,数据搜索速度超过以往所有方法。要知道,哈希表因为简易快速高性能,被广泛应用于计算机科学和编程中。而这种新型哈希表在最坏情况下的查询和插入时间与(log x) ²成正比,远比之前认为的x快。后者正是...