阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势

2024-01-31
阅读 8 分钟
598
随着春节大促即将到来,为了确保线上业务高效稳定地运行,电商企业大多会对旗下关键业务应用进行多轮测试。通过模拟线上较高流量的请求,来观察服务性能的实际表现。以某企业的业务测试报告举例:

阿里云参编业内首个代码大模型标准,通义灵码获 2023 AI4SE “银弹” 案例

2024-01-30
阅读 2 分钟
753
日前,中国人工智能产业发展联盟智能化软件工程工作组(AI for Software Engineering,下文简称AI4SE)在京召开首届“AI4SE创新巡航”活动。阿里云作为 AI4SE 首批成员单位,与中国信息通信研究院等组织联合发起的《智能化软件工程技术和应用要求第一部分:代码大模型》(标准编号 AIIA/PG 0110-2023)。

Nacos 官网重大升级,提供官方发行版下载包,3.0 里程碑版本新特性预告

2024-01-29
阅读 7 分钟
1.3k
Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,Nacos 开源产品定位是更易于构建云原生应用的动态服务发现、配置管理和服务管理平台,用云原生方式解决分布式领域核心问题。

MSE Nacos 配置变更审计平台使用指南

2024-01-29
阅读 5 分钟
915
Nacos [ 1] 作为一款业界主流的微服务注册中心和配置中心,管理着企业核心的配置资产,由于配置变更的安全和稳定诉求越来越高,因此我们提供了安全和可追溯性保障机制。

AI 绘画平台难开发,难变现?试试 Stable Diffusion API Serverless 版解决方案

2024-01-29
阅读 21 分钟
776
Stable Diffusion 模型,已经成为 AI 行业从传统深度学习时代走向 AIGC 时代的标志性里程碑。越来越多的开发者借助 stable-diffusion-webui(以下简称 SDWebUI)能力进行 AI 绘画领域创业或者业务上新,获得高流量及商业价值,但是面对多客户、高并发的复杂场景,使用原生 Stable Diffusion API 会面临以下挑战:

​让游戏云原生化别再「左右为难」

2024-01-26
阅读 3 分钟
551
当下,游戏行业正在经历云原生架构转型期,不少游戏厂商纷纷投入游戏服容器化改造。在此现象的背后,是云原生技术带来的先进生产力推动着行业向前发展:容器化提升了游戏交付的效率;声明一致性带来游戏开服效率、更新效率、以及可用性的提升;弹性伸缩使得资源可自动化地应对游戏高峰期与波谷期,在保证游戏服务质量的...

Higress × OpenKruiseGame 游戏网关最佳实践

2024-01-26
阅读 5 分钟
693
OpenKruiseGame(下文简称:OKG)是一个面向多云的开源游戏服 Kubernetes 工作负载,是 CNCF 工作负载开源项目 OpenKruise 在游戏领域的子项目,其提供了热更新、原地升级、定向管理等常用的游戏服管理功能。而游戏作为典型的流量密集型场景,在吞吐量、延迟性能、弹性与安全性等方面对入口网关提出了很高的要求。

一文详解全栈可观测的实现路径

2024-01-25
阅读 9 分钟
772
曾庆国,来自阿里云智能-云原生可观测团队。过去多年一直从事云原生相关领域工作。从运营开源产品到商业产品研发;从应用交付、平台工程到深入云原生可观测。多次通过 KubeCon、ArchSummit、A2M、云原生峰会等平台分享云原生实践经验。

上一任留下的 Eureka,我该如何提升她的性能和稳定性(含数据比对)?

2024-01-25
阅读 6 分钟
695
周末的时候,和一位在国内某互联网公司负责运维的朋友聊天,由于工作相关,刚好聊到了公司项目中微服务架构这块的一些问题,他们公司的微服务架构使用的是业界比较常用的 Spring Cloud Netflix 那一套作为底座,有专门的同学负责运维一套自建的 Eureka 集群来作为微服务注册中心。服务注册中心作为微服务领域的核心组件...

小红书如何做混部?

2024-01-25
阅读 7 分钟
585
Koordinator 是一个开源项目,是基于阿里巴巴内部多年容器调度、混部实践经验孵化诞生,是行业首个生产可用、面向大规模场景的开源混部系统,致力于提升应用服务质量,优化资源使用效率。自 2022 年 4 月正式开源以来,吸引了业界众多优秀工程师的贡献参与和讨论。

17 位社区大咖寄语,Seata 进入 Apache 孵化器

2024-01-25
阅读 6 分钟
699
北京时间 2023 年 10 月 29 日,分布式事务开源项目 Seata 正式通过 Apache 基金会的投票决议,以全票通过的优秀表现正式成为 Apache 孵化器项目!

Higress 开源一周年:新版本,新标准,新工具,新征程

2024-01-25
阅读 9 分钟
603
Higress 开源一年时间,一共发布了 18 个 release 版本,收获了 40 多位社区贡献者和 1800+ star,上图是这一年过来达成的一些关键的里程碑。

下一代软件架构,如何构建微服务核心能力

2024-01-25
阅读 6 分钟
512
随着数字化进程的加速,各种架构设计思想风起云涌,进入百家争鸣时代,微服务架构,云原生架构,Serverless 架构,事件驱动架构,中台架构,容灾架构,到底哪种思潮代表未来呢?

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

2024-01-25
阅读 12 分钟
549
RocketMQ 5.0 提出了分级存储的新方案,经过数个版本的深度打磨,RocketMQ 的分级存储日渐成熟,并成为降低存储成本的重要特性之一。事实上,几乎所有涉及到存储的产品都会尝试转冷降本,如何针对消息队列的业务场景去做一些有挑战的技术优化, 是非常有意思的事。

2023 年度技术盘点:从13个企业关心的问题看懂用云范式的改变

2024-01-25
阅读 5 分钟
642
今天,容器和 K8s 已经成为应用研发运维的新标准,行业调研数据显示,2022 年有 64% 的最终用户在生产环境中使用了 K8s;2022 年托管在云上的 K8s 集群增速达到了 127%。我们也看到云托管的 K8s 将在 2023 年超过本地部署。这意味着容器化上云成为了新常态。

构建端到端可观测全景丨云栖大会可观测分享实录

2024-01-24
阅读 8 分钟
537
随着 Kubernetes 、Serverless 等云原生技术引领研发、运维模式变革。应用架构从单体架构逐步演进为分布式、微服务化应用。生产关系不断变化,DevOps / 运维自动化、业务中台化让可观测不止于大促保障与日常轮值。同时,Prometheus、Grafana、Opentelemetry 等可观测标准也逐渐形成。SRE / DevSecOps / BizOps / FinOps ...

如何降低微服务复杂度丨云栖大会微服务主题分享实录

2024-01-24
阅读 4 分钟
400
作者:谢吉宝本文整理自阿里云资深技术专家、中间件负责人谢吉宝在2023云栖大会《极简微服务模式,降低微服务复杂度的最佳实践》的分享2023 云栖大会现场当面临复杂的挑战时,"分而治之"的方法往往能取得显著的效果。微服务架构在这方面的贡献尤为突出,它不仅为"分"与"治"这两个环节提供了深思熟虑的理论指导,还进一步...

Kruise Rollout 全链路灰度实践

2024-01-24
阅读 18 分钟
663
在发布应用的过程中,我们通常希望用少量特定流量来验证新版本的发布是否正常,以保障整体稳定性。这个过程被称为灰度发布。关于灰度发布,我们通过逐步增加发布的范围,来验证新版本的稳定性。如果新版本出现问题,我们也能及时发现,控制影响范围,保障整体的稳定性。

应用监控 eBPF 版:实现高效协议解析的技术探索

2024-01-24
阅读 5 分钟
673
随着 Kuberentes 等云原生技术的飞速发展,带来了研发与运维模式的变革。企业软件架构由单体服务向分布式、微服务演进。随着业务发展,多语言、多框架、多协议的微服务在企业中越来越多,软件架构复杂度越来越高,如何快速通过可观测工具快速定位出问题对研发人员至关重要。为满足全场景、端到端的应用监控需求,应用实...

Kube Queue:Kubernetes 任务排队的利器

2024-01-24
阅读 5 分钟
848
批处理作业(Batch Job)常应用于数据处理、仿真计算、科学计算和人工智能等领域,主要用于执行一次数据处理或模型训练任务。由于这类任务往往需要消耗大量计算资源,因此必须根据任务的优先级和提交者的可用资源情况进行合理排队,才能最大化集群资源的利用效率。

云原生网关哪家强:Sealos 网关血泪史

2024-01-24
阅读 4 分钟
870
Sealos 公有云上线以来,用户呈爆发式增长,目前总共注册用户 8.7w,每个用户都去创建应用,每个应用都需要有自己的访问入口,就导致整个集群路由条目非常巨大,需要有支撑数十万条 Ingress 的能力。

Apache Dubbo 下一代云原生微服务挑战赛启动报名!五大赛题 50 万奖金池

2024-01-24
阅读 1 分钟
498
Apache Dubbo 是一款微服务框架,为大规模微服务实践提供高性能 RPC 通信、流量治理、可观测性等解决方案,涵盖 Java、Golang 等多种语言 SDK 实现。随着越来越多的企业迁移上云,单位算力的成本在逐渐的下降。这使得在云原生如何构建下一代微服务体系成为一项挑战,Dubbo3 创新性的提出了 Triple 协议、应用级服务发现...

期待已久!阿里云容器服务 ACK AI 助手正式上线

2024-01-24
阅读 4 分钟
504
2023 年云栖大会上,阿里云容器服务团队正式发布 ACK AI 助手,带来大模型增强智能诊断,帮助企业和开发者降低 K8s 的运维复杂度。这款国内首家云原生容器场景的原生 AI 产品 —— ACK AI 助手 beta 版现已全面上线, 功能欢迎大家试用。

大语言模型推理提速:TensorRT-LLM 高性能推理实践

2024-01-24
阅读 8 分钟
1k
大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型。底层转换器是一组神经网络,这些神经网络由具有 self-attention 的编码器和解码器组成。编码器和解码器从一系列文本中提取含义,并理解其中的单词和短语之间的关系。

Koordinator v1.4 正式发布!为用户带来更多的计算负载类型和更灵活的资源管理机制

2024-01-24
阅读 12 分钟
437
Koordinator 作为一个积极发展的开源项目,自 2022 年 4 月发布 v0.1.0 版本以来,经历了多次迭代,持续为 Kubernetes 生态系统带来创新和增强。项目的核心是提供混部工作负载编排、混部资源调度、混部资源隔离和混部性能调优的综合解决方案,帮助用户优化容器性能,并提升集群资源使用效率。

百万并发!API 网关抗住了亚运会流量高峰

2024-01-24
阅读 4 分钟
332
2023 年杭州亚运会给大家留下了美好的回忆,当时各种线上线下的活动和赛事也将如火如荼地展开,与亚运会相关的应用和服务迎来流量高峰。作为亚运会所有核心流量的入口,阿里云 API 网关的重要性不言而喻。为了确保 API 网关能够稳定、高效地处理大量的并发请求,阿里云推出了一款百万并发规格的 API 网关, 为亚运会提供...

阿里云 SAE 2.0 正式商用丨云原生 2023 年 12 月产品技术动态

2024-01-24
阅读 6 分钟
510
云原生月度动态云原生是企业数字创新的最短路径。《阿里云云原生每月动态》,从趋势热点、产品新功能、服务客户、开源与开发者动态等方面,为企业提供数字化的路径与指南。趋势热点🥇 阿里云 SAE 2.0 正式商用,进一步普惠企业和开发者SAE 重磅推出了 2.0 全新版本:除支持开源微服务/定时任务无缝迁移外,新增支持 Web ...

秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?

2024-01-23
阅读 6 分钟
469
在前面的文章《弹性调度助力企业灵活应对业务变化,高效管理云上资源》中,我们介绍了阿里云容器服务 ACK 弹性调度为了帮助客户解决在使用云上弹性资源时,面对的“难以差异化控制业务资源使用量,缩容时部分业务 Pod 未释放”等挑战,提供了按照多级资源的优先顺序进行调度,以及按照定义的优先顺序进行缩容的能力。

解读 EventBridge Transform:数据转换和处理的灵活能力

2024-01-23
阅读 5 分钟
436
阿里云 EventBridge 提供了强大而灵活的事件总线服务,它可以连接应用程序、阿里云云服务和阿里云 Serverless 服务来快速构建 EDA(Event-driven Architectures)事件驱动架构,驱动应用与应用,应用与云的连接。除此之外,它还可以作为流式的数据管道,在不同的数据仓库和数据处理或分析程序之间快速构建 ETL 系统。