基于 K8s 容器集群的容灾架构与方案

3 月 13 日
阅读 8 分钟
350
在设计系统架构时,我们必须假设任何组件和任何基础设施可能会在任何时间失效,例如:自然灾害,电力中断,网络中断,错误的系统变更等。为了应对挑战,我们必须设计合适的容灾架构。

【体验有奖】用 AI 画春天,函数计算搭建 Stable Diffusion WebUI

3 月 13 日
阅读 7 分钟
274
人工智能生成内容 AIGC(Artificial Intelligence Generated Content)是当下备受关注的概念之一,是继 PGC 和 UGC 之后的新型生产方式。AIGC 技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。例如,根据用户的描述或关键词,即时创作出独特的艺术风格画像,实现个性化的艺术创造。本实验基于 Stable Di...

一键开启 GPU 闲置模式,基于函数计算低成本部署 Google Gemma 模型服务

3 月 13 日
阅读 6 分钟
396
Google 在 2024 年 02 月 21 日正式推出了自家的首个开源模型族 Gemma ,并同时上架了四个大型语言模型,提供了 2B 和 7B 两种参数规模的版本,每种都包含了预训练版本(base 模型)和指令微调版本(chat 模型) [ 1] 。根据 Google 的技术报告,本次开源的 Gemma 在问题回答、合理性、数学、代码等方面的性能均超越同参...

嘿!AI 编码新玩法上线!

3 月 11 日
阅读 3 分钟
208
随着 AI 智能浪潮到来,AI 编码助手成为越来越多开发者的必备工具,将开发者从繁重的编码工作中解放出来,极大地提高了编程效率,帮助开发者实现更快、更好的代码编写。

破晓未来·迎接智能新时代:混合 AI 大模型开发者工作坊震撼预告

3 月 11 日
阅读 2 分钟
187
随着科技的日新月异,人工智能正在以前所未有的速度渗透进各行各业,而大模型作为 AI 技术的前沿探索,正引领着新一轮的技术革新风暴。在此背景下,一场专为 AI 领域热衷者与开发者精心筹备的 “混合 AI 大模型开发者工作坊·AI 云边端协同最佳实践” 即将拉开序幕!

一文看懂如何做好 SQL 质量监控

3 月 11 日
阅读 4 分钟
186
在 SLS 中,用户可以通过 SQL 对日志数据(结构化、半结构化、无结构化)进行查询和分析。随着用户对 SQL 使用程度的不断加深,越来越多的用户希望了解自己使用 SQL 分析时的服务反馈(如请求量、成功率、数据量等等),以便对数据和分析行为进行精细管理或优化治理。

对话| 阿里云大降价后,再谈“降本增效”

3 月 7 日
阅读 9 分钟
222
近日,在InfoQ发起的圆桌讨论上,InfoQ、极客邦科技创始人 & CEO霍太稳,与阿里云智能集团副总裁、公共云首席解决方案架构师韩鸿源,掌阅科技 CTO、AI 业务负责人孙凯,贝联珠贯创始人&CEO、CCF杰出工程师林昊(毕玄),共同围绕云上的降本增效、Twitter“下云”真相、自建IDC和上云成本比对,及大模型时代的机会,展开思...

使用 SPL 高效实现 Flink SLS Connector 下推

3 月 7 日
阅读 8 分钟
293
日志服务 SLS 是云原生观测与分析平台,为 Log、Metric、Trace 等数据提供大规模、低成本、实时的平台化服务,基于日志服务的便捷的数据接入能力,可以将系统日志、业务日志等接入 SLS 进行存储、分析;阿里云 Flink 是阿里云基于 Apache Flink 构建的大数据分析平台,在实时数据分析、风控检测等场景应用广泛。阿里云 F...

云消息队列 Confluent 版正式上线!

3 月 6 日
阅读 5 分钟
262
在 2023 年杭州云栖大会上,Confluent 成为阿里云技术合作伙伴,在此基础上,双方展开了深度合作,并在今天(3月1日)正式上线“云消息队列 Confluent 版”。

应用监控 eBPF 版:实现 Golang 微服务的无侵入应用监控

3 月 6 日
阅读 3 分钟
371
在现代软件架构中,微服务已成为构建可扩展和灵活应用程序的流行方式。每个微服务负责应用程序的一部分功能,它们共同工作以提供完整的服务。由于微服务架构的分散特性,监控变得至关重要,有效的微服务监控是确保高可用性、可靠性和服务质量的关键组成部分,它支撑了整个系统的健康运行和业务的持续增长。

立即报名|3 月 8 日北京,稳定性 & 可观测沙龙来了!

2 月 29 日
阅读 1 分钟
299
在云原生时代,微服务、容器化等技术从根本上改变了应用研发/运维方式。在提升效率的同时,也带来了更复杂的故障分析流程,这使得可观测成为云原生架构下非常重要的课题。本次活动将由阿里云技术专家为我们带来可观测性实践经验和技术方案分享。

IDC 中搭建 Serverless 应用平台:通过 ACK One 和 Knative 玩转云资源

2 月 29 日
阅读 5 分钟
280
如何打造云上(公共云)、云下(IDC 数据中心)统一的云原生 Serverless 应用平台,首先我们来看一下 ChatGPT 4 会给出什么样的答案:

PTS 3.0:开启智能化的压测瓶颈分析

2 月 28 日
阅读 4 分钟
399
性能测试 PTS(Performance Testing Service)是阿里云上一款简单易用,具备强大的分布式压测能力的 SaaS 压测平台。PTS 可以模拟复杂的业务场景,并快速精准地调度不同规模的流量,同时提供压测过程中多维度的监控指标和日志记录。用户无需准备资源,即可按需发起压测任务,监控压测指标,获取压测报告,进而能够高效率...

弱结构化日志 Flink SQL 怎么写?SLS SPL 来帮忙

2 月 27 日
阅读 8 分钟
366
日志服务 SLS 是云原生观测与分析平台,为 Log、Metric、Trace 等数据提供大规模、低成本、实时的平台化服务,基于日志服务的便捷的数据接入能力,可以将系统日志、业务日志等接入 SLS 进行存储、分析;阿里云 Flink 是阿里云基于 Apache Flink 构建的大数据分析平台,在实时数据分析、风控检测等场景应用广泛。阿里云 F...

AI 编程如何颠覆生产力 | 参与体验免费领取 ArchSummit 架构师峰会专属门票

2 月 26 日
阅读 1 分钟
287
InfoQ 正在筹备 2024 年 6 月 14-15 日深圳 ArchSummit 架构师峰会,阿里云云原生应用平台负责人丁宇受邀在会议上演讲,他的演讲会围绕 AI 颠覆程序员 / 开发者生产力展开,随着大模型、AI 的快速发展, AI 编程助手的引入为软件开发带来了质的飞跃。

青团社:亿级灵活用工平台的云原生架构实践

2 月 26 日
阅读 9 分钟
500
青团社是国内领先的一站式灵活用工招聘服务企业,灵活用工行业的 Top1。青团社于 2013 年在杭州成立,业务已经覆盖全国,在行业深耕 10 年。我的分享将分为以下三部分:

基于 Fluid+JindoCache 加速大模型训练的实践

2 月 22 日
阅读 7 分钟
470
时间步入了 2024 年,新的技术趋势,如大模型/AIGC/多模态等技术,已经开始与实际业务相结合,并开始生产落地。这些新的技术趋势不仅提高了算力的需求,也给底层基础设施带来了更大的挑战。

你好,iLogtail 2.0!

2 月 21 日
阅读 10 分钟
518
随着可观测数据采集需求的不断推陈出新,多样化的数据输入输出选项、个性化的数据处理能力组合、以及高性能的数据处理吞吐能力已经成为顶流可观测数据采集器的必备条件。然而,由于历史原因,现有的 iLogtail 架构和采集配置结构已经无法继续满足上述需求,逐渐成为制约 iLogtail 继续向前快速演进的瓶颈:

多人协同开发场景,如何做到高效发布

2 月 20 日
阅读 4 分钟
397
微服务架构下,每个应用服务独立开发、独立发布,小步快跑,持续快速交付业务需求。多人协同开发同一个应用时,分支开发模式是一个适合的协同方案。该模式下一个需求或任务通常对应一个 feature 分支,多个需求一起合并到 release 分支进行集成测试验证并发布。期间可能遇到以下问题:

ACK One:构建混合云同城容灾系统

2 月 19 日
阅读 5 分钟
411
对于当前业务运行在 IDC 内的 Kubernetes 集群中,希望通过云计算为云下业务提供同城灾备的高可用冗余能力,可利用阿里云分布式云容器平台 ACK One [ 1] 来提供统一得流量、应用和集群管理,实现业务流量的多集群路由和灾难情况下的流量的自动平滑容灾。本文主要介绍通过 ACK One 快速构建混合云同城容灾系统。

想要一个龙年头像,在线等挺急的

2 月 19 日
阅读 1 分钟
836
AIGC 生成姓氏头像火爆全网,阿里云开发者社区X函数计算推出新活动!2 步基于函数计算搭建 AI 艺术字应用,晒姓氏头像赢 Cherry 机械键盘 MX8.0(价值 800+)、小米移动电源等新春好礼!该场景基于 Stable Diffusion API Serverless 版解决方案打造,上手简单、帮助 AI 开发者轻松实现 AI 绘画平台开发、变现!

阿里云参编业内首个代码大模型标准丨云原生 2024 年 1 月产品技术动态

2 月 8 日
阅读 4 分钟
673
阿里云作为 AI4SE 首批成员单位,与中国信息通信研究院等组织联合发起的《智能化软件工程技术和应用要求第一部分:代码大模型》(标准编号 AIIA/PG 0110-2023)。同时,阿里云“通义灵码智能编码助手”也荣获 2023 年 AI4SE 银弹优秀案例。

面向智算服务,构建可观测体系最佳实践

2 月 8 日
阅读 10 分钟
561
对于越来越火爆的人工智能领域来说,MLOps 是解决这一领域的系统工程,它结合了所有与机器学习相关的任务和流程,从数据管理、建模、持续部署的到运行时计算和资源管理。下图是开源 ML-Ops 平台 MLReef 在 2021 年发布的 ML 市场相关工具和平台玩家。时至今日,相关工具与平台玩家数量保持着持续高速增长。当前,随着大...

极致成本,如何基于容器计算服务 ACS 打造企业级幻兽帕鲁私服 SaaS 服务?

2 月 6 日
阅读 6 分钟
289
《幻兽帕鲁》是一款最近大热的开放世界生存游戏。据报道。上市不到一周,《幻兽帕鲁》销量已突破 700 万份,成为名副其实的现象级游戏。根据游戏数据库网站 SteamDB 的数据显示,《幻兽帕鲁》Steam 同时在线人数最高达到 201 万,成为史上同时在线玩家数量最高的付费游戏之一。

有奖讨论丨你能看出来哪些是 AI 写的代码么?

2 月 6 日
阅读 1 分钟
324
随着 AI 智能浪潮到来,AI 智能编码助手成为越来越多开发者的必备工具,Github Copilot、Amazon CodeWhisperer 等 AI 编码工具陆续登场,去年云栖大会阿里云发布的 “通义灵码” 同样令人期待。

ACK One Argo工作流:实现动态 Fan-out/Fan-in 任务编排

2 月 6 日
阅读 6 分钟
393
在工作流编排过程中,为了加快大任务处理的效率,可以使用 Fan-out Fan-in 任务编排,将大任务分解成小任务,然后并行运行小任务,最后聚合结果。

解密 ARMS 持续剖析:如何用一个全新视角洞察应用的性能瓶颈?

2 月 6 日
阅读 7 分钟
344
随着软件技术发展迭代,很多企业软件系统也逐步从单体应用向云原生微服务架构演进,一方面让应用实现高并发、易扩展、开发敏捷度高等效果,但另外一方面也让软件应用链路变得越来越长,依赖的各种外部技术越来越多,一些线上问题排查起来变得困难重重。

告别 GPU 焦虑,玩转极致性价比的 CPU 文生图

2 月 6 日
阅读 4 分钟
327
AIGC 中的 Stable Diffusion 文生图模型是开源流行的跨模态生成模型,用于生成给定文本对应的图像。但由于众所周知的原因,GPU 资源出现了一卡难求的现状,如何通过云计算快速提升业务规模,降低文生图的计算成本,以及更好的保护自定义的扩展模型?针对文生图模型特性和规模化场景,本文提供了一种新的思路,通过云原生...

「云原生可观测团队」获选「InfoQ 年度技术内容贡献奖」

2 月 6 日
阅读 2 分钟
253
随着云原生、人工智能逐渐成为各行各业的创新生产力工具。可以预见,我们即将进入全新的智能化时代。随着数据成为新型生产要素,云和 AI 正走向深度融合。云原生通过提供大规模多元算力的高效供给,可观测成为业务创新的核心基础设施,加速智能化创新。这一过程离不开开发者、企业、厂商、机构、媒体的持续推动产业演进...