开源项目推荐

KubeAI

KubeAI 是一个 K8s 上的 AI 推理操作器,旨在简化在生产环境中部署和管理大型语言模型(LLM)、向量嵌入和语音处理等机器学习模型。它提供与 OpenAI 兼容的 API,支持在 CPU 和 GPU 上运行,并具备按需自动扩缩容的能力。

KubeAI 无需依赖 Istio、Knative 等其他系统,能够在几乎任何 K8s 集群中开箱即用。此外,它内置了模型代理,优化了键值缓存利用率,从而显著提升系统性能。KubeAI 还提供了预配置的流行模型目录,支持 LoRA 微调和模型缓存,简化了模型的部署和管理。

Spark Operator

Spark Operator 是一个 K8s 原生的开源项目,旨在简化 Apache Spark 作业在 K8s 集群上的部署和管理。它利用 K8s 的自定义资源(CRD)来定义和管理 Spark 应用,使用户能够以声明式方式提交、监控和管理 Spark 作业,而无需手动配置复杂的 K8s 资源。该项目支持自动化资源管理、作业失败重试、日志收集以及与 K8s 生态系统的无缝集成,适用于大规模数据处理和机器学习应用。

Capsule

Capsule 是一个多租户管理开源项目,旨在增强 K8s 的租户隔离能力,使企业能够在同一集群内安全高效地运行多个租户的应用。Capsule 通过 K8s 的原生机制(如命名空间、策略和角色)提供细粒度的访问控制,并支持资源配额、网络隔离和自定义策略,从而简化企业级 K8s 多租户管理。该项目特别适用于 SaaS 提供商、云服务平台和大型企业,希望在 K8s 上高效管理多个团队或客户的资源。

文章推荐

应对 K8s 规模扩张与 AI 工作负载的未来之路

本文探讨了 Kubernetes 规模扩张(Kubernetes Sprawl) 带来的挑战,以及如何更好地支持 AI 工作负载。随着企业越来越多地采用 K8s,集群数量不断增加,导致管理复杂性上升、资源浪费、治理难度加大,并且运维成本飙升。同时,AI 工作负载的兴起对 K8s 的计算、存储和调度能力提出了更高的要求,使得集群管理变得更加棘手。文章提出了一些关键的应对策略,包括 自动化管理、集中式治理、GPU 资源优化、混合云架构以及云原生 AI 基础设施,以帮助企业在 K8s 规模扩展的同时,提升 AI 计算的运行效率。

避免 Kubernetes 部署中的五大常见错误

这篇文章探讨了在部署 K8s 时常见的五个错误,并提供了相应的最佳实践,以帮助构建可扩展、安全且适用于生产环境的 K8s 集群。首先,未配置资源请求和限制可能导致资源争用和性能问题,建议在部署 YAML 中明确设置 CPU 和内存的请求与限制。其次,忽视安全最佳实践,如以 root 身份运行容器或使用默认服务账户,可能引发安全风险,建议使用 Pod 安全标准、启用基于角色的访问控制(RBAC)等措施。

第三,缺乏适当的日志记录和监控会使问题排查变得困难,建议使用集中式日志解决方案和监控工具,如 Fluentd、Elasticsearch、Kibana 或 Prometheus。第四,错误配置 Ingress 和网络可能导致连接问题或安全漏洞,建议使用合适的 Ingress 控制器并实施 TLS 加密。最后,未能进行集群自动扩缩容可能导致资源利用率低下或服务中断,建议使用 K8s 的自动扩缩容功能来优化资源使用。

用 DeepSeek 打样!KubeSphere LuBan 用 3 天/3 分钟 “干掉” 大模型部署焦虑

本文介绍了 KubeSphere 社区基于全新的 LuBan 架构,在短短 3 天内开发出适用于 DeepSeek-R1 大模型的专属扩展组件。通过集成 Ollama 运行时和 NextChat 交互界面,开发者可以在 KubeSphere 控制台上轻松地加载模型、启动和监控服务,简化了大模型的部署流程。该实践展示了 KubeSphere 在扩展性和灵活性方面的强大能力,为开发者提供了一个简单易用的工具,帮助他们快速部署和管理大模型服务。

云原生动态

Kubescape 成为 CNCF 孵化项目

CNCF 技术监督委员会 (TOC) 已投票接受 Kubescape 作为 CNCF 孵化项目。

Kubescape 是一个开源的 K8s 安全项目,旨在为整个开发和部署生命周期提供全面的安全覆盖。它提供姿态和漏洞管理,以及自动加固策略。此外,Kubescape 还提供基于 eBPF 的威胁检测功能,能够识别云工作负载的异常和可疑行为。Kubescape 既可以作为 CLI 工具,也可以作为 K8s 操作器使用。CLI 工具用于手动扫描、脚本编写和 CI/CD 集成,而 Kubescape 操作器则是一组微服务,从内部监控您的 K8s 集群。

Keycloak JS 26.2.0 发布

Keycloak JS 26.2.0 于近日发布,标志着 JavaScript 适配器发展的重要里程碑。此版本未引入功能性更改,但实现了与主项目发布周期的独立,使其能够更频繁地发布新功能和修复,并更迅速地响应社区反馈。代码库已迁移至独立的存储库,提升了维护性。未来,团队将评估是继续重构 Keycloak JS,还是与成熟的第三方库合作,甚至用成熟的社区解决方案替代。

关于KubeSphere

KubeSphere (https://kubesphere.io)是在 Kubernetes 之上构建的开源容器平台,提供全栈的 IT 自动化运维的能力,简化企业的 DevOps 工作流。

KubeSphere 已被 Aqara 智能家居、本来生活、东方通信、微宏科技、东软、华云、新浪、三一重工、华夏银行、四川航空、国药集团、微众银行、紫金保险、去哪儿网、中通、中国人民银行、中国银行、中国人保寿险、中国太平保险、中国移动、中国联通、中国电信、天翼云、中移金科、Radore、ZaloPay 等海内外数万家企业采用。KubeSphere 提供了开发者友好的向导式操作界面和丰富的企业级功能,包括 Kubernetes 多云与多集群管理、DevOps (CI/CD)、应用生命周期管理、边缘计算、微服务治理 (Service Mesh)、多租户管理、可观测性、存储与网络管理、GPU support 等功能,帮助企业快速构建一个强大和功能丰富的容器云平台。

本文由博客一文多发平台 OpenWrite 发布!

KubeSphere
124 声望58 粉丝

KubeSphere 是一个开源的以应用为中心的容器管理平台,支持部署在任何基础设施之上,并提供简单易用的 UI,极大减轻日常开发、测试、运维的复杂度,旨在解决 Kubernetes 本身存在的存储、网络、安全和易用性等痛...