零售行业正在探索应用 AI 升级客户体验,同时优化内部流程。面对多重应用场景以及成本优化压力,团队可采用成本相对可控的方案,来应对多重场景的前期项目预演和落地,避免短期内大规模投入造成的资源浪费。
客户体验 AI 场景的研究目前集中在 AI 客服,内部流程主要是 AI 营销、合同生成、合规审查和供应链优化等。在项目研究和前期预演阶段,采用NVIDIA RTX™ 系列的高性能GPU,进行本地化部署大模型,已经可以经济又高效地应对多数的 AI 场景开发。
1、AI 客服场景与适配算力
很多零售企业在转型中开始基于 DeepSeek 搭建客服,客服场景以对话交互为主,输入与输出较短,对并发、首字延迟有一定需求。接下来列举几个常用模型场景,以及我们所测试的算力方案数据。
- 选择模型 DeepSeek-R1 32B(FP16),采用4卡NVIDIA RTX™ 5000 Ada(单卡32GB显存)的方案,可以支持约64个用户同时进行简单问答,来保障首字时延控制大约在1秒以内;采用 8卡 NVIDIA RTX™ 5000 Ada 则可以支持至120多个并发,首字时延保持在2秒以内。
测试数据来源:赞奇科技
本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。
- 选择模型 DeepSeek-R1 70B(FP16),采用 8卡NVIDIA RTX™ 5880 Ada(单卡48GB显存) 的平台方案,能够应对80多个并发,首字时延控制在3秒以内。
测试数据来源:赞奇科技
本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。
- 通义千问 QWQ 32B 模型因其回答问题逻辑性强,逐渐被用户所认可,性能直逼 DeepSeek 满血版,采用4卡NVIDIA RTX™ 5000 Ada (单卡32GB显存)时,并发数在100以内时,平均用户吞吐率可以达到 14 tokens/s。
*测试数据来源:赞奇科技
*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。
*数据测试环境:4卡测试环境:CPU:Intel(R)Xeon(R) w5-3433,内存:256GB DDR5,硬盘:1TB。
8卡测试环境:CPU:英特尔® 至强® Silver 4314,内存:256GB DDR4,硬盘:3.84TB。
2、AI 营销场景与适配算力
依托 DeepSeek 模型逐步开发企业自有的智能营销工作流,可以极大地降本增效。该场景则以知识库场景为主,需要流畅地对海量文档、数据库信息进行检索和输出内容,长输入长输出场景居多,对于并发、时延、吞吐率都有一定要求。
对于小型团队来说,采用4卡 NVIDIA RTX 5000 Ada 的机型方案,可以应对基本的扩散模型训练、文生图、文生视频等生成式 AI 设计需求,也能应对 AI 营销文案制作、数据分析处理等应用,可预期达到的性能效果如下:
- 采用 DeepSeek-R1 32B(FP16)模型,长输入、长输出的场景中,能够支持64个并发,保证流畅地信息检索和输出;
- 采用通义千问 QWQ 32B (FP16)模型,长输入长输出的场景里,能够较好地支持到80个并发。
*测试数据来源:赞奇科技
*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。
对于大型项目或团队来说,搭载 8卡 NVIDIA RTX 5880 Ada 并行计算,预期的性能效果如下:
- 采用 DeepSeek-R1 32B(FP16)模型,长输入、长输出的场景中,能够很好地支持80个并发;
- 采用 DeepSeek-R1 70B(FP16)模型,长输入、长输出的场景中,可以较好地支持16个并发。
*测试数据来源:赞奇科技
*测试环境同上
*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。
生成式 AI 设计项目中,ComfyUI 工作流可以较好地帮助企业快速地制作产品营销图/视频,更快地迭代营销方案。所涉及的模型如 SDXL,Flux 等,在高 batch size 情形下的训练和推理,GPU 显存建议在24GB以上。我们测试了一些 batch size 模型训练和推理的场景数据,供大家在 GPU 选型时做参考:
*以上数据使用电商数据集进行测试,数据来源于赞奇科技
*数据测试环境:
GPU: NVIDIA RTX 5000 Ada (32GB) 1 / NVIDIA RTX 5880 Ada (48GB) 1
CPU: Intel i5-12600KF (3.7GHz) *1,
内存:64GB,系统:win 11
在生成式 AI+三维可视化结合开发产品配置器、线上导购、数字人导购员等数字孪生场景中,NVIDIA RTX GPU 既可以进行 AI 训练推理,又因为其具有 RT core,也可以用于支持图形可视化场景,这是其独到的优势。这类数字孪生的营销场景,需要由 NVIDIA RTX 5000 Ada 或 NVIDIA RTX 5880 Ada 来做助力,才能运行得起较为复杂的模型和高并发的场景。
3、其他 AI 应用场景
其他 AI 应用场景例如合同生成、合规审查、供应链优化、用户行为分析等,需要实时处理大量数据,进行复杂的模型推理与分析,可采取四卡乃至八卡 NVIDIA RTX 5880 Ada 的方案,凭借高显存与超强的并行计算能力来执行较为复杂的 AI 任务。例如合同生成,同样也是大语言模型推理中,主要涉及长输入、长输出的场景,数据可参考上方 AI 营销场景的数据。
供应链优化、用户行为分析等场景,需具体依据用户的数据库、系统等信息来做判断,赞奇目前开放免费为用户咨询评估,具体可复制下方链接登记。
rlzqlo1asm.feishu.cn/share/base/form/shrcnCbOVoltOXPQjFxveqrrIQb
以上数据均为测试得出,为用户高效地选型提供参考。但涉及到用户的多重场景和特殊需求,建议大家提前做机器测试,以调整至最优方案。下面列出上方提到的两个型号显卡的具体参数。
这两个型号均为 NVIDIA RTX Ada Lovelace 架构的顶配显卡,AI 能力与图形性能都远远超过了上一代安培架构“卡皇”——NVIDIA RTX™ A6000。
NVIDIA RTX 系列高性能显卡参数概览
*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。