开源项目推荐

HAMi

HAMi(原名 k8s‑vGPU‑scheduler)是一款 CNCF Sandbox 级别的开源 K8s 中间件,通过虚拟化 GPU/NPU 等异构设备并支持内存、计算核心时间片隔离及共享调度,为容器提供统一接口,实现细粒度资源配额与隔离(无需改动程序)、提高设备利用率与调度灵活性,并已在公有云、私有云及金融、制造、电信等多行业广泛应用。

SkyPilot

SkyPilot 是一个由 Berkeley Sky Computing Lab 开发的开源框架,通过统一的 YAML/CLI/Python 接口,让用户轻松地在 Kubernetes 或 16+ 个云平台(如 AWS、GCP、Azure 等)上自动调度 AI、训练、服务和批处理任务,并通过智能选最便宜的区域(含 spot 实例自动恢复)与自动清理闲置资源,实现高 GPU 可用性与显著降低成本。

Trainer

Trainer 是一个 K8s 原生的开源项目,旨在通过统一的 Python SDK、CRD(TrainJob、TrainingRuntime 等)和控制器,支持多种 ML 框架(如 PyTorch、TensorFlow、JAX、XGBoost)进行大规模分布式训练与 LLM 微调,并集成 Hugging Face、DeepSpeed、Megatron‑LM 等生态以提升扩展性,同时通过 CPU 侧加载器降低 GPU 初始化成本,使训练任务可自动扩展、迁移、优化资源并支持多云部署。

Envoy AI Gateway

Envoy AI Gateway 是一个开源的、K8s 原生的 AI 网关,基于 Envoy Gateway 和 Envoy Proxy 构建,旨在为应用流量提供一个统一、安全、可扩展的入口,连接各类大模型(LLM)和生成式 AI 服务。它通过标准化不同厂商的 API(目前支持 OpenAI 和 AWS Bedrock),实现智能路由与故障转移,支持基于令牌的限流与访问控制策略,上游身份认证(如 API Key、AWS 签名、OIDC 等),并通过 CRD 和 Helm 与 K8s 深度集成。

文章推荐

Kubernetes v1.33:容器生命周期更新

本文介绍了 Kubernetes v1.33 对容器生命周期的新特性更新,包括 Sleep 动作支持零秒持续时间(默认启用)以及引入 Alpha 阶段的容器停止信号配置能力。Sleep 动作为容器启动前或终止前提供暂停机制,零值支持简化了配置和镜像依赖;而新的容器停止信号特性允许用户通过 Pod 规范明确指定终止信号,提升容器优雅关闭的可控性和跨平台兼容性。这些增强提升了 Kubernetes 对容器生命周期的灵活性与可操作性。

轻量级 K8s 迎来里程碑:k0s 正式加入 CNCF 沙箱

k0s 是一个轻量、零依赖的 Kubernetes 发行版,仅通过单个二进制文件即可部署完整集群,适用于从开发者笔记本、大型数据中心到资源受限的边缘计算环境。近期,k0s 正式加入 CNCF Sandbox,这标志其进入云原生生态早期项目层级,借此获得更广泛的社区支持、反馈、合作机会与曝光度,为提升 Kubernetes 使用便捷性、可访问性与透明开源治理打开新的篇章。

云原生动态

Podman Desktop 1.19 版本发布

Podman Desktop 1.19 于近期成功发布,更新了内置的 Podman 可执行程序至 v5.5,改进了稳定性和功能,并带来多个扩展功能增强:Bootc 1.9 支持直接从可启动容器创建 VM、AI Lab 1.7.2 增加 llama‑stack 和模型上下文协议、新增 Minc(MicroShift 容器部署)、RHEL lightspeed 与 RHEL VMs 扩展,且现在可以在 RHEL 10 上直接安装使用 Podman Desktop。

GitLab 发布自托管 GitLab 18 版本,新增 AI 代码辅助功能

GitLab 正式发布了自托管版 GitLab 18.0,于 2025 年 6 月 6 日上线,为 Premium 和 Ultimate 用户引入了原生 AI 功能,包含语境智能的 Duo 代码建议、实时 IDE 聊天、代码生成与重构等,提高代码审核效率。这些 AI 功能已整合至常用 IDE 和合并请求流程中,能跨文件全面分析变更内容,降低无效提示。自托管环境亦内置 Repository X‑Ray 智能分析,并强化安全与合规,包括增强 SAST 和漏洞追踪;平台还新增细粒度 CI/CD 权限、SHA256 SAML 证书支持及删除保护等细节更新。

关于KubeSphere

KubeSphere (https://kubesphere.io)是在 Kubernetes 之上构建的开源容器平台,提供全栈的 IT 自动化运维的能力,简化企业的 DevOps 工作流。

KubeSphere 已被 Aqara 智能家居、本来生活、东方通信、微宏科技、东软、华云、新浪、三一重工、华夏银行、四川航空、国药集团、微众银行、紫金保险、去哪儿网、中通、中国人民银行、中国银行、中国人保寿险、中国太平保险、中国移动、中国联通、中国电信、天翼云、中移金科、Radore、ZaloPay 等海内外数万家企业采用。KubeSphere 提供了开发者友好的向导式操作界面和丰富的企业级功能,包括 Kubernetes 多云与多集群管理、DevOps (CI/CD)、应用生命周期管理、边缘计算、微服务治理 (Service Mesh)、多租户管理、可观测性、存储与网络管理、GPU support 等功能,帮助企业快速构建一个强大和功能丰富的容器云平台。

本文由博客一文多发平台 OpenWrite 发布!

KubeSphere
127 声望61 粉丝

KubeSphere 是一个开源的以应用为中心的容器管理平台,支持部署在任何基础设施之上,并提供简单易用的 UI,极大减轻日常开发、测试、运维的复杂度,旨在解决 Kubernetes 本身存在的存储、网络、安全和易用性等痛...