关注前沿科技 量子位一个眼神锁定你!多模态视觉定位能力升级——由单张图像拓展至多图像应用场景。比如,在复杂的相册中自动识别出Luigi并在第二张图中找到他,或是根据钢铁侠剧照自动在合影中找到对应的演员唐尼。Q:Image-1 is the photo album of someone in Image-2, please find and locate this person.回答:(371,...
关注前沿科技 量子位用扩散模型替代自回归,大模型的逆诅咒有解了!人大高瓴人工智能研究院、蚂蚁共同提出LLaDA(a Large Language Diffusion with mAsking)。LLaDA-8B在上下文学习方面与LLaMA3-8B能力相当,而且在反转诗歌任务中超越GPT-4o。在大语言模型领域,反转诗歌是一个特殊任务,它用来评估模型在处理语言模型的...
关注前沿科技 量子位就在刚刚,奥特曼发了个推特,轻描淡写透露了个大消息:For our next open source project……读到第一句,咱就眼前一亮,OpenAI居然又要有开源项目了?!仔细读完整条推文,居然是真的。奥特曼这条推文就是向大家征集,OpenAI的下一个开源项目,到底是做啥更好。方案1,做一个非常小,仍需要在GPU上运...