头图

图片
英伟达

在人工智能领域,科技巨头们的角力从未停歇。英伟达悄然推出的开源模型 Nemotron-70B,如一颗重磅炸弹,在 AI 圈掀起了新的波澜。这个被誉为"新王登基"的模型在某些方面超越了 GPT-4,引发了业内广泛关注和热议。

Nemotron-70B

图片
Nemotron-70B 部分论文展示 

Llama-3.1-Nemotron-70B-Instruct 是由 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的响应对用户查询的帮助性。Nemotron-70B采用了一种创新的混合训练方法,巧妙地将Bradley-Terry和 Regression 奖励模型结合在一起。而且 Nemotron-70B 采用了人类反馈强化学习(RLHF)方法,特别是 REINFORCE 算法,这使得模型在理解和执行指令方面表现出色。

图片
Nemotron-70B 评估指标

目前 Nemotron-70B 达到 Arena Hard 的 85.0、AlpacaEval 2 LC 的 57.6 和 GPT-4-Turbo MT-Bench 的 8.98,截至到 2024 年 10 月 1 日,Llama-3.1-Nemotron-70B-Instruct 在 Arena Hard、AlpacaEval 2 LC (verified tab) 和 MT Bench (GPT-4-Turbo) 上表现最佳。

技术优势

图片
Nemotron-70B 测试排名

Nemotron-70B 的技术优势主要体现在以下几个方面:

长文本处理能力:模型在处理长度超过 500个token 的文本时表现出色,这对于复杂任务的处理至关重要。

多语言能力:支持50多种自然语言和40多种编程语言,大大拓展了其应用范围。

架构优化:通过增强的多查询注意机制和优化的变压器设计,实现了计算速度和准确性的完美平衡。

能效提升:相比前代模型,Nemotron-70B 显著降低了能耗,这对于大规模部署来说是一个巨大优势。

实测结果

图片
“草莓”问题测试

从官方给出的测试案例来看,面对之前大火的”草莓“测试来看,Nemotron-70B 能完美答对。

图片
外网用户实测评

价也有使用者给出了超高的评价:Nemotron-70B 在基准测试上超过了 GPT-4o 和 Sonnet-3.5,这是我用过的最好的中型模型!

有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。


厚德云
6 声望6 粉丝

厚德云是一个专业的 GPU 算力云平台,专注于为人工智能从业者提供高效、便捷、灵活的 GPU 算力资源租用服务。我们旨在帮助客户加速人工智能的研发和应用进程,实现业务的快速发展。