AWS 发布并行计算服务(PCS)以加速科学计算
亚马逊云服务(AWS)近日宣布其新的并行计算服务(Parallel Computing Service, PCS)正式全面上线。该服务旨在显著减少处理复杂科学计算所需的时间,进一步提升高性能计算(HPC)的效率。
AWS 在 HPC 领域的创新历史
AWS 在支持高性能计算(HPC)工作负载方面有着长期的创新历史,此前已推出多项相关服务,如:
- AWS ParallelCluster:用于管理 HPC 集群。
- AWS Batch:用于批量计算。
- Elastic Fabric Adapter:提供低延迟网络。
- Amazon FSx for Lustre:高性能文件系统。
- 基于 AMD、Intel 和 Graviton 的专用 HPC 计算实例。
PCS 的核心功能
PCS 是一项完全托管的综合性 HPC 服务,旨在消除创建和管理 HPC 集群的复杂工作。系统管理员可以通过以下方式创建集群:
- 使用 Amazon EC2 实例。
- 采用低延迟网络和优化存储,专为 HPC 工作负载设计。
科学家和工程师可以快速扩展模拟,以验证模型和设计。此外,系统管理员和集成商还可以使用流行的开源 HPC 工作负载管理器 Slurm 在 AWS 上构建和管理 HPC 集群。目前,PCS 支持 Slurm 23.11,并提供了升级机制,以便用户在新版本发布后轻松升级。
简化 HPC 环境管理
AWS PCS 通过 AWS 管理控制台、AWS SDK 和 AWS 命令行界面(CLI) 提供访问,简化了由 AWS 管理的高性能计算环境。AWS 首席开发者倡导者 Channy Yun 表示:
PCS 使用 Slurm 作为高度可扩展、容错的任务调度器,科学家、研究人员和工程师可以登录 PCS 集群运行和管理 HPC 任务,使用交互式软件访问数据,并将工作负载快速迁移到 PCS,而无需花费大量精力移植代码。
此外,用户还可以利用完全托管的 NICE DCV 远程桌面,在一个平台上实现远程可视化和监控 HPC 工作流。
应用场景
AWS PCS 适用于多种传统和前沿工作负载,包括:
- 计算流体动力学
- 天气建模
- 有限元分析
- 电子设计自动化
- 储层模拟
服务区域和定价
目前,PCS 已在以下 AWS 区域上线:
- 美国东部(弗吉尼亚北部)
- 美国东部(俄亥俄)
- 美国西部(俄勒冈)
- 亚太(新加坡)
- 亚太(悉尼)
- 亚太(东京)
- 欧洲(法兰克福)
- 欧洲(爱尔兰)
- 欧洲(斯德哥尔摩)
具体定价可在 PCS 定价页面查看。
总结
AWS PCS 的推出标志着 AWS 在 HPC 领域的进一步深化,通过提供完全托管的服务,显著降低了科学计算的复杂性,使科学家和工程师能够更高效地解决复杂问题。无论组织规模大小,用户都可以利用顶级 HPC 能力,快速扩展和验证模型,推动科学发现和技术创新。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。