量子位技术号 - SegmentFault 思否

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

2024-08-04

阅读 7 分钟

3

原创关注前沿科技量子位家人们，咱就说这个国产Sora啊，就在七月这一个月时间里，那“增速”简直就是霸屏模式——可灵、PixVerse V2、清影、Vidu……面对眼前一水儿的AI视频生成软件，相信大家也和我一样：感慨过后，一个想法立即浮上心头：能不能把它们拉到一起，搞个横评，看看谁家的国产Sora更胜一筹？说干就干，我们先来...

AI顶会ICML收了一篇论文：没算法没实验

2024-08-04

阅读 5 分钟

4

“Vocabulary for Universal Approximation: A Linguistic Perspective of Mapping Compositions（词的万能逼近：从语言角度看映射组合）”，这篇纯理论论文讲了什么，何以入选Spotlight？

大型AI行为艺术：「人类止步」贴吧，17个大模型疯狂灌水｜开源

2024-08-04

阅读 4 分钟

3

关注前沿科技量子位这个贴吧里的网友，都不是人！但是它们却能从诗词歌赋，聊到人生哲学。甚至还会叠楼讨论：俺们AI做的梦是不是模拟梦？这些AI楼主都活跃在一个叫Deaddit的虚拟贴吧平台。Deaddit这个名字是对Reddit的一个有趣模仿。Reddit相当于是国外网友的贴吧，Deaddit则是一个虚拟的版本，而里面的“用户”也像它的...

“3分钟热度”真的只能持续3分钟吗？

2024-08-04

阅读 5 分钟

9

量子位以下文章来源于中科院物理所，作者Meyare[中科院物理所 .物理所科研动态和综合新闻；物理学前沿和科学传播。](#)当暑假的大门缓缓打开，我怀揣着雄心壮志：“要啃下那本砖头厚的📚，成为🎸的演奏高手，还要掌握一项让人眼前一亮的🎨技能。”现在这些计划进展得如何了？嗯，让我想想。📚书，我翻了前几页，然后它就变成...

硅谷大模型独角兽打折卖身谷歌！Transformer作者创办，估值179亿，盈利难以预计

2024-08-03

阅读 4 分钟

4

不仅两位创始人——Transformer“贡献最大”作者Noam Shazeer（诺姆·沙泽尔）和Daniel De Freitas（丹尼尔·德·弗雷塔斯）宣告回归，研究团队部分成员也追随其后。

鹅厂机器狗登Nature子刊封面：动作敏捷如真狗，能玩定向越野

2024-08-03

阅读 4 分钟

4

关注前沿科技量子位腾讯机器狗，登上了Nature子刊封面！在它的控制下，机器狗的动作和真实世界中的狗越来越像了。注意看，这里的两只机器狗玩起了“定向越野”，还是带追逐的那种。游戏当中，两只机器狗分别要扮演追逐者和逃脱者，逃脱者需要在不被抓到的情况下到达指定位置。一旦它到达了指定位置，两只机器狗就会交换身...

GPT-4o弱点暴露了，PDF长文档阅读理解仅45分

2024-08-03

阅读 3 分钟

3

图文并茂的PDF长文档在日常生活中无处不在。过去人们通常使用OCR，layout detection等方法对PDF长文档进行解析。但随着多模态大模型的发展，PDF长文档的端到端阅读理解成为了可能。

AI太火，量子位今年更缺人了（含实习）

2024-08-03

阅读 3 分钟

3

关注前沿科技量子位AI太火了！眼睛一睁一闭，一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是，今年的量子位，比以往更加缺人。这不到金三银四了，是时候拿出喇叭大喊一声：量子位招！人！啦！量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

OpenAI喜提姚班学霸姚顺雨：思维树作者，普林斯顿博士，还是个Rapper

2024-08-02

阅读 7 分钟

8

原创关注前沿科技量子位清华姚班学霸姚顺雨，官宣加入了OpenAI。而就是这么一则简短的消息，却引来了圈内众人的围观和祝福，来感受一下这个feel：其中不乏像OpenAI前沿研究主管、美国IOI教练Mark Chen，以及AI领域的教授、投资人等等。那么这位姚顺雨，到底为何能够引来如此关注？从他过往的履历来看，我们可以提炼出...

人间一年，AI时代发电厂在京浮出水面！国产芯片集结，智能算力开箱即用

2024-08-02

阅读 4 分钟

4

原创关注前沿科技量子位人工智能毫无疑问是当今一项重要议题，通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。然而，服务AI的基础设施——算力和数据，是限制人工智能发展的瓶颈，也成了进一步讨论的话题。为什么到现在仍然存在这样的瓶颈？又该如何打破？我们在成立一年的北电数智所做的事里看到了一些...

Stable Diffusion原班人马新公司官宣！新模型一夜刷新AI绘画格局，已获2.3亿元融资

2024-08-02

阅读 6 分钟

3

3月宣布从Stability AI出走的Robin Rombach，就是Stable Diffusion的两个主要作者之一，和十来个原公司小伙伴，正式宣布了组团创业的消息。

起猛了，GPT-4o被谷歌新模型击败，ChatGPT官号：大家深吸一口气

2024-08-02

阅读 4 分钟

3

原创关注前沿科技量子位起猛了，GPT-4o被谷歌新模型超越了！历时一周，超1,2000人匿名投票，Gemini 1.5 Pro（0801）代表谷歌首次夺得lmsys竞技场第一。（中文任务也第一）而且这次还是双冠王，除了总榜（唯一分数上1300），在视觉排行榜上也是第一。Gemini团队的关键人物Simon Tokumine发文庆祝称：(这一新模型）是我...

大模型成私人导游，一键规划Citywalk，港大MIT联合出品

2024-08-02

阅读 3 分钟

5

关注前沿科技量子位现在，大模型可以做私人导游，为你规划Citywalk路线了——港大MIT等单位联合推出ITINERA，将LLM与空间优化相结合，实现个性化的开放域城市行程规划。举个栗子，用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的citywalk路线”。ITINERA系统立马生成了一条包含若干地点的路线，并提供了相应的介绍文...

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

2024-08-02

阅读 4 分钟

4

关注前沿科技量子位单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！最近Llama-3.1登上开源顶峰，但其最强的405B版本模型900多GB的内存需求，对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC，能很好解决这一问题。它使得一张80G A100即可完成Llama 3.1 405B的校准和...

吴恩达弟子打造arXiv弹幕版，每篇论文都能自由讨论了！

2024-08-01

阅读 5 分钟

5

原创关注前沿科技量子位现在，arXiv的每篇论文，都能直接提问讨论了！只需把URL中的arXiv替换成AlphaXiv，就能对任意一篇论文发布提问或讨论。或者是下载插件，网页上就会多出一个Discuss的入口，点开是一样的效果。这就是由斯坦福AI实验室学生构建的论文开放讨论论坛“AlphaXiv”。任何人注册ID后就能发布评论。刚刚全...

想跑千亿大模型？算力厂商放大招！CPU通用服务器成为新选择

2024-08-01

阅读 4 分钟

3

原创关注前沿科技量子位千亿参数规模的大模型推理，服务器仅用4颗CPU就能实现！在一台CPU通用服务器上，浪潮信息成功跑通了102B大模型推理。如果推广开来，没有专用芯片的传统行业，不必更换硬件，也能用上AI了。△浪潮信息通用服务器NF8260G7服务器成功运行千亿参数大模型这套方案以极低的延时，近乎实时地进行推理运...

ChatGPT版「Her」被玩疯：哭着读诗，中文表现也很亮

2024-08-01

阅读 6 分钟

3

关注前沿科技量子位上线仅仅一天，GPT-4o的高级语音功能（Advanced Voice Mode）简直要被玩疯了。无数网友脑洞大开的疯狂测试，GPT-4o这边呢，不仅各种奇葩任务全盘接收，表现好到更是让不少人连连惊呼“Blow my mind”。例如有位网友要求GPT-4o用中文讲个故事，它的表现是这样的：<iframe class="video_iframe rich_p...

贾扬清：大模型尺寸正在重走CNN的老路；马斯克：在特斯拉也是这样

2024-08-01

阅读 4 分钟

3

关注前沿科技量子位Transformer大模型尺寸变化，正在重走CNN的老路！看到大家都被LLaMA 3.1吸引了注意力，贾扬清发出如此感慨。拿大模型尺寸的发展，和CNN的发展作对比，就能发现一个明显的趋势和现象：在ImageNet时代，研究人员和技术从业者见证了参数规模的快速增长，然后又开始转向更小、更高效的模型。听起来，是不...

21岁天才少年创业AI硬件一夜爆火：710元换一个挂在脖子上的AI朋友

2024-08-01

阅读 4 分钟

4

关注前沿科技量子位99美元（约710人民币），就能和AI“交个朋友”？一条叫做Friend的“AI项链”在推特上爆火，浏览量已超过2000万。在Rabbit、Humane接连翻车，人们对AI硬件大失所望的背景下，Friend却异军突起，赢来了网友们的接连好评。<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_357...

开放域检测新SOTA！中山大学美团出品，开源性能最强

2024-08-01

阅读 3 分钟

5

关注前沿科技量子位开放域检测领域，迎来新进展——中山大学联合美团提出新模型OV-DINO，实现开放域检测开源新SOTA！比Grounding DINO高12.7% AP，比YOLO-World 高4.7% AP。目标检测技术一直是研究的热点。但传统的目标检测方法往往受限于预定义的类别集合，难以应对现实世界中种类繁多的物体。为了突破这一限制，开放词...

超精细开放世界藏进小程序，他们用游戏技术复刻北京中轴线，穿越古今的那种

2024-07-31

阅读 6 分钟

3

原创关注前沿科技量子位听说了吗，北京最火citywalk路线，北京中轴线申遗成功了~并且这一次，不仅是靠历史文化价值稳稳拿下，还整出了十足的科技范儿——全球首次利用游戏科技全程参与世界文化遗产申报。怎么个科技法？网友们的反馈be like：俺们仔细一查才发现，原来为了提升公众参与度（如今也是申遗的一个重要考核标...

失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三

2024-07-31

阅读 4 分钟

3

关注前沿科技量子位AI大神李沐老师时隔1年多，终于回归B站“填坑”经典论文精读系列了！没错，最新主角儿还是Llama-3.1：在这个18分钟左右的视频中，李沐老师手把手教我们读Llama-3.1技术论文，甚至还爆料了一些八卦。（指路7分50秒左右）他提到，Llama团队在训练最大模型时，其实一开始同时训练了MoE模型和稠密模型，但...

Midjourney新版本上线即爆火！网友已玩疯：和摄影几乎没区别

2024-07-31

阅读 3 分钟

6

关注前沿科技量子位Midjourney v6.1刚刚发布立刻爆火！各种人像大片，一气呵成。画面、光线、人物表情动作……都更加逼近现实。雕像的细致纹理，也能细致还原。对比上一版本v6，各方面提升都非常显著。网友感慨：这和摄影大片已经几乎没区别了。结合最近runway的Gen-3，有人只用45分钟就做出来了细节真实度都拉满的风格大...

Claude团队引众怒，为爬数据不择手段，给爬虫改名字无视禁止规则

2024-07-31

阅读 4 分钟

4

关注前沿科技量子位Claude团队这次惹了众怒！原因：24小时内访问某公司服务器100万次，以不付费形式，爬虫抓取网站内容。不仅明目张胆无视了“禁止爬取”的公告，还强行占用了服务器资源。这家“受害者”公司其实尽力防御了，但阻止失败，内容数据还是被Claude抓走了。公司负责人气得吹胡子瞪眼，在x上激情开麦：嘿，Anthro...

国产多模态卷上下文长度：原生支持24K图文输入输出，图像视频理解对标GPT4V

2024-07-31

阅读 3 分钟

5

关注前沿科技量子位国产多模态大模型，也开始卷上下文长度。书生·浦语灵笔（InternLM-XComposer）多模态大模型升级2.5版本——原生支持24K多模态图文上下文，超过20轮的图文交互，具备图像视频理解、网页创作、图文写作等多项功能。该开源模型一出，一度在Hugging Face登上热榜第五。作为8B量级性能最优秀的多模态大模型...

AI加持创作，「小说-剧本-视频」只需一人全搞定｜对话波形智能

2024-07-31

阅读 2 分钟

4

关注前沿科技量子位现在，在网文小说的创作中，竟然也有了AI参与协作的身影！？没有思路，可以与AI一起头脑风暴。差点细节，交给AI吭哧吭哧来补全。不论是专业作者，还是网文小白，都可以在AI工具的协助下进行创作。这就是「蛙蛙写作」正在做的 —— 从头脑风暴到语句润色，从小说续写到剧本创作，让AI为创作者的创意打工...

苹果AI版iOS首日火爆：聊天秒变高情商，大模型成最强嘴替，Siri华丽变身

2024-07-30

阅读 6 分钟

7

关注前沿科技量子位它来了它来了，苹果的Apple Intelligence终于与果粉见面了！随着iOS 18.1 Beta版的上线，注册开发者从即日起就能体验到苹果AI的部分功能。最明显的一处就是Siri的全面换新，变身成了Apple Intelligence & Siri。另一项重磅更新就是写作功能了，它可以帮忙润色推特评论，三下五除二就能把高级表达...

Meta「分割一切」进化2.0！一键跟踪运动物体，代码权重数据集全开源，网友：真正的OpenAI

2024-07-30

阅读 4 分钟

2

关注前沿科技量子位又是发布即开源！Meta“分割一切AI”二代SAM2在SIGGRAPH上刚刚亮相。相较于上一代，它的能力从图像分割拓展到视频分割。可实时处理任意长视频，视频中没见过的对象也能轻松分割追踪。更关键的是，模型代码、权重以及数据集通通开源！它和Llama系列一样遵循Apache 2.0许可协议，并根据BSD-3许可分享评估...

寡姐带货国风Polo衫，马斯克穿牛仔走红毯！虚拟试衣新框架火了，只需两张图30秒即生成

2024-07-30

阅读 3 分钟

4

关注前沿科技量子位只需两张图像，不到30秒，就能让马斯克穿牛仔走红毯~或者让寡姐带货国风Polo衫~就是二次元换装也不在话下。来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以Stable Diffusion v1.5 inpainitng为基础模型。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不...

防不胜防！AI几米外隔空窥屏，HDMI线把信号泄露到空气里了

2024-07-30

阅读 3 分钟

4

关注前沿科技量子位防不胜防！黑客通过显示器数据线泄露的信号，就能偷窥你的屏幕内容。具体来说，是HDMI数据线的电磁辐射，会把一些显示信号泄露到周围空气中。本来也没什么，但是结合AI就可逆向得到原始画面内容。来自乌拉圭共和国大学工程学院的团队提出了一种端到端模型，专注于文本恢复，能将泄露信号（如HDMI）的...

10

10