轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例

轻量型 GPU 应用首选京东智联云推出 NVIDIA vGPU 实例

在使用异构计算服务的场景中，“计算资源过剩”问题十分普遍。以云游戏为例，企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算。针对这类对算力需求较少的应用场景，轻量型异构计算产品则更为适用。

为了让用户可以用更细粒度的计算资源开启业务，京东智联云近期推出了基于NVDIA vGPU技术的虚拟化GPU实例，借助软件通过分片虚拟化技术将物理GPU卡重新划分，分割后的vGPU具有相应划分比例的计算能力和显存，同一块GPU卡经虚拟化分割后可分配至不同的云主机使用。用户在云上可以根据负载选择算力匹配的实例规格，满足多种异构计算场景，降低云上GPU使用成本。

京东智联云推出的vGPU云主机实例包含C类型（Virtual Compute Server）和Q类型（Quadro vDWS）两款，均搭载NVIDIA® Tesla® P40，支持1/2、1/4、1/6 三种划分粒度，并提供多种CPU、内存配置组合，用户可以按需选择适量的计算资源，提升系统灵活性，并大幅降低成本。

C类型vGPU实例主要面向AI、计算机学习和科学计算等场景，多适用于高校设计院、研究机构等深度学习的教学和实验场景；Q类型vGPU实例主要面向影视行业的实时渲染、图形图像处理和建筑工业设计等专业图像处理场景，可支持Maya、3DMAX、UG、BIM等专业级图形处理软件，满足用户对GPU在图形设计方面的需求。

▲C类型（Virtual Compute Server）vGPU实例规格▲

▲Q类型（Quadro vDWS）vGPU实例规格▲

在vGPU技术面世以前，云上GPU云主机大多采用直通模式（GPU passthrough），直通模式下GPU绕过操作系统，作为物理设备直接提供给虚拟机使用，由于没有设备的模拟和转换过程因此性能损失极小，能够满足多数大规模并行计算场景。

但是，直通模式下受限于GPU卡的物理使用限制，单台云主机至少搭载一块GPU，物理服务器GPU的数量又决定了云主机CPU和内存的分配比例，如业务在多数运行时间对GPU算力需求较少，会存在大量的计算资源浪费。因此，GPU核心平均使用率较低的轻量型GPU应用，非常适合选用vGPU规格主机来进行部署。

轻量型模型推理服务

深度学习场景下，在线推理所需的GPU资源往往少于离线训练，但是工作负载受线上业务影响会存在一定波动，高峰时期会有大量并发。此类业务部署时可以根据工作负载选择合适的vGPU规格主机作为集群的最小部署单元，以使得集群计算能力更贴合实际计算力需求曲线，提高GPU资源的使用率，优化成本。

教学、开发场景

高校及教学机构在开展AI相关课程时，需要提供搭载GPU的服务器作为基础教学实践环境，参与课程的人员研究方向和业务水平各异，对GPU资源算力的需求也不尽相同，在云上根据教学任务按需申请不同规格的vGPU云主机和GPU云主机，既能满足各种场景下的资源需求，又可以节省教学资源。

与物理GPU卡不同的是，NVIDIA vGPU面向不同的场景，提供四种类型产品。每种类型vGPU运行时需要相应的软件授权（License），对操作系统的要求也有所区别。

除此之外，不同类型的vGPU产品在诸多功能特性上也有所差异，详细说明可以前往NVIDIA官网查阅（请戳链接 http://3.cn/15-k06ay）。

在授权方式上，vGPU云主机运行后会向预先配置的License Server服务器发起授权请求，成功获取License后会以标准性能运行，如获取License失败将会在性能受限的模式下运行直至获得授权。vGPU云主机只有在运行时才会消耗License，主机停止或释放时，License会被License Server自动回收。

推荐阅读：

欢迎点击【京东智联云】，了解开发者社区

更多精彩技术实践与独家干货解析

欢迎关注【京东智联云开发者】公众号

轻量型 GPU 应用首选京东智联云推出 NVIDIA vGPU 实例

京东云开发者

引用和评论

业务监控—一站式搭建jmeter+telegraf+influxdb+Grafana看板

GPUDirect RDMA 的演进与实现

阿里云 ESA 游戏行业解决方案｜安全防护、加速、低延时的技术融合

PyTorch CUDA内存管理优化：深度理解GPU资源分配与缓存机制

云电竞巅峰对决：ToDesk/网易云/START实战测评，谁是真王者？

算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案

计算加速技术比较分析：GPU、FPGA、ASIC、TPU与NPU的技术特性、应用场景及产业生态

轻量型 GPU 应用首选 京东智联云推出 NVIDIA vGPU 实例

京东云开发者

引用和评论

业务监控—一站式搭建jmeter+telegraf+influxdb+Grafana看板

GPUDirect RDMA 的演进与实现

阿里云 ESA 游戏行业解决方案｜安全防护、加速、低延时的技术融合

PyTorch CUDA内存管理优化：深度理解GPU资源分配与缓存机制

云电竞巅峰对决：ToDesk/网易云/START实战测评，谁是真王者？

算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案

计算加速技术比较分析：GPU、FPGA、ASIC、TPU与NPU的技术特性、应用场景及产业生态

轻量型 GPU 应用首选京东智联云推出 NVIDIA vGPU 实例