阿里云 ACK 云原生 AI 套件中的分布式弹性训练实践

1 月 21 日
阅读 6 分钟
310
众所周知,随着时间的推移,算力成为了 AI 行业演进一个不可或缺的因素。在数据量日益庞大、模型体量不断增加的今天,企业对分布式算力和模型训练效率的需求成为了首要的任务。如何更好的、更高效率的以及更具性价比的利用算力,使用更低的成本来训练不断的迭代 AI 模型,变成了迫切需要解决的问题。而分布式训练的演进...

调研 7 个开源项目后,这家数据合规平台如何构建高性能网关

1 月 21 日
阅读 6 分钟
344
用九智汇是一家面向企业提供数据合规、隐私保护相关产品和解决方案的数据合规公司,致力于帮助客户在合法合规、充分保护用户隐私的基础上发挥数据的最大价值,已服务众多世界 500 强企业。当前我们的产品交付主要基于云原生相关的基础设施和开源技术栈,如 Kubernetes、Istio、Apache Dubbo、Alibaba Nacos 等,既支持以...

当 OpenTelemetry 遇上阿里云 Prometheus

1 月 21 日
阅读 23 分钟
418
在云原生可观测蓬勃发展的当下,想必大家对 OpenTelemetry & Prometheus 并不是太陌生。OpenTelemetry 是 CNCF(Cloud Native Computing Foundation)旗下的开源项目,它的目标是在云原生时代成为应用性能监控领域的事实标准,它提供了一套统一的 API 和 SDK,用于生成、收集和处理分布式系统的遥测数据。总而言之,Open...

恭喜 Apache Dubbo 和 Nacos 荣获开放原子“2023年度生态开源项目”

1 月 21 日
阅读 1 分钟
268
12 月 16 日,以“一切为了开发者”为主题的开放原子开发者大会在江苏省无锡市开幕。江苏省工业和信息化厅厅长朱爱勋、中国开源软件推进联盟主席陆首群等领导和专家参加开幕式,工业和信息化部信息技术发展司副司长王威伟、江苏省工业和信息化厅副厅长池宇、无锡市人民政府副市长周文栋、开放原子开源基金会理事长孙文龙参...

为大模型工程提效,基于阿里云 ACK 的云原生 AI 工程化实践

1 月 21 日
阅读 11 分钟
593
以 GPT(Generative Pre-trained Transformer)和 Diffusion model 为代表的大语言模型(Large language model,LLM)和生成式人工智能(Generative artificial intelligence,GAI)在过往两年,将人们对 AI 的梦想与期待推向了一个新高峰。这一次,AI 带来的“智能”效果和“涌现”能力,吸引着千行百业都在积极思考如何在...

Nacos 2.3.0 正式版发布,Nacos Controller 项目开源

1 月 21 日
阅读 7 分钟
385
Nacos 2.3.0-BETA 版本经过 1 个多月的社区测试,修复了部分的问题并对部分新功能的使用进行了少量优化后,于 2023 年 12 月 7 日正式发布。

从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

1 月 21 日
阅读 10 分钟
448
安全一直是企业上云关注的核心问题。随着云原生对云计算基础设施和企业应用架构的重定义,传统的企业安全防护架构已经不能够满足新时期下的安全防护要求。为此企业安全人员需要针对云原生时代的安全挑战重新进行系统性的威胁分析并构建适合企业自身的威胁情报系统,同时在云原生安全体系方法论的指导下,结合云服务商提...

独家好书丨《智算时代的容器技术演进与实践》免费下载

1 月 21 日
阅读 1 分钟
226
2023 云栖大会容器服务 ACK 分享实录合辑《智算时代的容器技术演进与实践》电子书正式上线!10+ 云栖精选议题带你深入了解容器技术与产品最新趋势、容器 AI 工程化探索与实战以及企业大规模应用实践案例。阿里云容器服务技术专家带您解读容器服务 ACK 如何加速现代化应用平台构建。

考试查分场景重保背后,我们如何进行可用性测试

1 月 21 日
阅读 6 分钟
289
随着通过互联网音视频与知识建立连接的新学习方式在全国范围内迅速普及,在线教育/认证考试的用户规模呈井喷式增长。但教育容不得半点马虎与妥协,伴随用户规模不断增长,保证系统稳定性、有效避免千万考生考试时遭遇故障风险,成为行业认证机构/部门解决的首要难题。

Seata 1.8.0 正式发布,支持达梦和 PolarDB-X 数据库

1 月 21 日
阅读 2 分钟
388
1.8.0 中对 AT 模式扩展了达梦和 PolarDB-X 2.0 数据库的支持。 共通过了 80 多组 jdk(8,11,17,21)+ Spring 各版本 + OS(x86,arm64)+ druid 主要版本的交叉兼容测试,可放心平滑升级。

解密最受欢迎的开源 Serverless 框架:流量篇

1 月 20 日
阅读 10 分钟
260
对于 web 应用来说,通过请求流量的并发数、qps、rt 等指标,可以很好的衡量当前的 web 服务质量。Knative 中提供了基于请求驱动的 Serverless 能力,包括多版本管理流量,流量访问,基于流量的弹性以及监控等。本文从流量角度出发,为您解密 Knative 相关的能力。

奶茶上云,原生的更好喝

1 月 18 日
阅读 6 分钟
185
茶百道成立于 2008 年,起初,茶百道坚持一步一个脚印,用了 8 年时间门店数量也只有 100 家。转折点发生在 2018 年,在这一年,茶百道正式开放全国性加盟,准备用规模来换市场。2020 到 2022 三年期间,营收和净利润都增长了 4 倍有余。这三年,也是茶百道数字化系统成功云原生化的演进历程。

阿里云云原生弹性方案:用弹性解决集群资源利用率难题

1 月 18 日
阅读 7 分钟
323
随着上云的认知更加普遍,我们发现除了以往占大部分的互联网类型的客户,一些传统的企业,一些制造类的和工业型企业客户也都开始使用云原生的方式去做 IT 架构的转型,提高集群资源使用率也成为企业上云的一致共识。大家上云的同时,开始思考有没有云原生的方法能更好地实现提高集群资源使用率这个核心目标。

Spring Boot 单体应用升级 Spring Cloud 微服务

1 月 18 日
阅读 7 分钟
321
Spring Cloud 是在 Spring Boot 之上构建的一套微服务生态体系,包括服务发现、配置中心、限流降级、分布式事务、异步消息等,因此通过增加依赖、注解等简单的四步即可完成 Spring Boot 应用到 Spring Cloud 升级。

使用函数计算,数禾如何实现高效的数据处理?

1 月 18 日
阅读 3 分钟
136
数禾科技以大数据和技术为驱动,为金融机构提供高效的智能零售金融解决方案,服务银行、信托、消费金融公司、保险、小贷公司等持牌金融机构,业务涵盖消费信贷、小微企业信贷、场景分期等多个领域,提供营销获客、风险防控、运营管理等服务。数禾科技通过自主开发的消费信贷产品,连接金融机构与普罗大众,赋能金融机构...

阿里云容器服务助力万兴科技 AIGC 应用加速

1 月 18 日
阅读 3 分钟
230
2023 年堪称是 AIGC 元年,文生图领域诞生了 Stable Diffusion 项目,文生文领域诞生了 GPT 家族。一时间风起云涌,国内外许多企业投身 AIGC 创新浪潮,各大云厂商紧随其后纷纷推出自己的大语言模型。在文生图领域落地的企业更多,国外的如 Midjourney,国内的如 AIGC 软件公司万兴科技等。

云原生场景下,AIGC 模型服务的工程挑战和应对

1 月 17 日
阅读 8 分钟
276
“成本”、“性能”和 “效率”正在成为影响大模型生产和应用的三个核心因素,也是企业基础设施在面临生产、使用大模型时的全新挑战。AI 领域的快速发展不仅需要算法的突破,也需要工程的创新。

模型服务网格:云原生下的模型服务管理

1 月 17 日
阅读 12 分钟
249
模型服务网格(Model Service Mesh)是一种架构模式,用于在分布式环境中部署和管理机器学习模型服务。它提供了一个可扩展的、高性能的基础架构,用于将多个模型服务进行管理、部署和调度,以此更好地处理模型的部署、版本管理、路由和推理请求的负载均衡。

RocketMQ 中冷热分离的随机索引模块详解

1 月 17 日
阅读 6 分钟
206
RocketMQ 广泛使用于各类业务场景中,在实际生产场景中,用户通常会选择消息 ID 或者特定的业务 Key(例如学号,订单号)来查询和定位特定的一批消息,进而定位分布式系统中的复杂问题。传统方案下,消息索引的存储是基于数据库系统或者基于本地文件系统实现的,受限于磁盘容量,很难满足海量数据的写入诉求。

云边协同的 RTC 如何助力即构全球实时互动业务实践

1 月 17 日
阅读 4 分钟
200
由 51 CTO 主办的“WOT 全球技术创新大会 2023·深圳站”于 11 月 24 日 - 25 日召开,即构科技后台技术总监肖潇以“边缘容器在全球音视频场景的探索与实践”为主题进行分享。 边缘计算作为中心云计算的补充,通过边缘容器架构和云边协同,为音视频、云游戏、元宇宙等场景带来了更好的用户体验和业务价值。

阿里云 ACK One 新特性:多集群网关,帮您快速构建同城容灾系统

1 月 17 日
阅读 5 分钟
564
近日,阿里云分布式云容器平台 ACK One [ 1] 发布“多集群网关” [ 2] (ACK One Multi-cluster Gateways)新特性,这是 ACK One 面向多云、多集群场景提供的云原生网关,用于对多集群南北向流量进行统一管理。

祝贺!我的同事丁宇获“2023 年度云原生产业领军人物”荣誉称号

1 月 17 日
阅读 2 分钟
182
日前,在云原生产业大会上,中国信息通信研究院授予我的同事丁宇“2023 年度云原生产业领军人物” 荣誉称号,以表彰其在云原生产业上的突出贡献与创新引领。组委会在评语中写到:“他开创性的打造全链路压测技术,解决突变峰值下复杂系统的容量确定性和系统稳定性问题;带领团队攻坚技术获得国家技术发明二等奖;此外,他带...

阿里云云原生专场精彩内容集锦丨2023 云原生产业大会

1 月 17 日
阅读 1 分钟
228
2023 云原生产业大会已于昨日闭幕,在阿里云云原生专场,来自阿里云的多位技术专家、中国信通院云大所副总工程师陈屹力及安永科技咨询合伙人王祺都带来了精彩的分享。

阿里云云原生助力安永创新驱动力实践探索

1 月 17 日
阅读 3 分钟
190
云原生正在成为新质生产力变革的核心要素和企业创新的数字基础设施。2023 年 12 月 1 日,由中国信通院举办的“2023 云原生产业大会”在北京召开。在大会“阿里云云原生”专场,安永科技咨询合伙人王祺分享了对云原生市场的总览及趋势洞见,及安永基于阿里云容器服务、消息、微服务引擎、可观测等云原生技术产品方案,持续获...

构建智算时代的云原生应用平台,2023 云原生产业大会,阿里云在这里!

1 月 17 日
阅读 4 分钟
245
在云原生技术规模化应用的关键时期,云原生前沿技术趋势、云原生技术的应用现代化建设、大模型的云原生算力供给、云原生安全防护新思路、行业应用实践等等都成为从业者的关注焦点。在云原生产业大会主论坛上,阿里云云原生应用平台资深产品总监李国强发表主题演讲。

Dubbo 3.3.0-beta 版本正式发布

1 月 11 日
阅读 5 分钟
1.8k
近日,Apache Dubbo 发布了 3.3 分支大版本 3.3.0-beta.1,相较于 3.2 系列版本,3.3.0-beta 引入了一些重量级的功能升级,按照社区规划,3.3 也将是 Dubbo3 非常重要的一个里程碑大版本,在 3.3.0 首个正式版本之后 Dubbo3 将正式进入长期稳定维护态,即标志着 Dubbo3 作为面向云原生时代的下一代微服务框架将具备规划...

云消息队列 Kafka 版生态谈第一期:无代码转储能力介绍

1 月 4 日
阅读 4 分钟
295
云消息队列 Kafka 版本身是一个分布式流处理平台,具有高吞吐量、低延迟和可扩展性等特性。它被广泛应用于实时数据处理和流式数据传输的场景。然而,为了将云消息队列 Kafka 版与其他数据源和数据目的地集成,需要额外的开发/组件来实现数据的传输和同步,客户需要大量的研发、运维等投入。