阿里巴巴云原生 - SegmentFault 思否

仅3步！即刻拥有 QwQ-32B，性能比肩全球最强开源模型

阿里云云原生

4 月 3 日

阅读 3 分钟

474

本文详细介绍如何将 QwQ-32B 开源模型部署到函数计算 FC（Function Compute），并通过云原生应用开发平台 CAP（Cloud Application Platform）实现 Ollama 和 Open WebUI 两个 FC 函数的部署。具体来说，Ollama 负责托管 QwQ-32B-GGUF 模型，而 Open WebUI 则用于提供用户界面，支持与模型的交互。

突破极限: 高负载场景下的单机300M多行正则日志采集不是梦

阿里云云原生

4 月 2 日

阅读 9 分钟

504

在当今数字化时代，日志数据已成为企业 IT 运营和业务分析的关键资源。然而，随着业务规模的扩大和系统复杂度的提升，日志数据的体量呈现爆发式增长，给日志采集和处理系统带来了巨大挑战。最近，我们遇到了一个典型案例，充分体现了当前日志服务采集在高负载场景下面临的困境，以下为客户现状：

Java版Manus实现来了，Spring AI Alibaba发布开源OpenManus实现

阿里云云原生

4 月 2 日

阅读 2 分钟

570

此次官方发布的 Spring AI Alibaba OpenManus 实现，包含完整的多智能体任务规划、思考与执行流程，可以让开发者体验 Java 版本的多智能体效果。它能够根据用户的问题进行分析，操作浏览器，执行代码等来完成复杂任务等。

当实时消费遇到 SPL：让数据处理更高效、简单

阿里云云原生

4 月 2 日

阅读 5 分钟

361

SLS 对实时消费进行了功能升级，推出了基于 SPL 的规则消费功能。在实时消费过程中，用户只需通过简单的 SPL 配置即可完成服务端的数据清洗和预处理操作。通过SPL消费可以将客户端复杂的业务逻辑“左移”到服务端，从而大幅降低了客户端的复杂性和计算开销。

Higress.ai 站点全新发布，轻松解锁 AI 新能力，开启全球服务！

阿里云云原生

4 月 2 日

阅读 4 分钟

510

随着大模型技术的快速发展，AI 应用的工程化对底层基础设施提出了诸多需求，尤其是工程化过程中在安全、效率、性能等方面提出了更高的诉求。其中，AI 网关是非常重要的 AI 基础设施组件之一。

直播预约｜ApsaraMQ x Confluent 云原生 Kafka 线上沙龙

阿里云云原生

4 月 2 日

阅读 1 分钟

353

云消息队列 Kafka 版是基于 Apache Kafka 构建的全托管服务，依托于阿里云强大的基础设施，对 Apache Kafka 进行了深度重构，通过存算分离架构、高弹性扩展、云服务深度集成等优化，致力于打造更经济、更稳定、更弹性的云原生 Kafka 产品，助力企业在数字化与智能化转型中，实现业务的稳定增长与创新突破。同时，阿里云...

大模型 Token 的消耗可能是一笔糊涂账

阿里云云原生

4 月 2 日

阅读 5 分钟

402

经典的 Web 应用，例如电商、游戏、出行、新能源、教育和医疗等，CPU 的消耗是可控的，和应用的在线人数和登陆时长成正相关，如果计算资源突增，可能是运营团队在做活动，也可能是预期外的突发流量，通过服务器弹性扩容后，稳定一段时间就会缩容到平时的状态，后端所消耗的资源是可追踪、可管控的。但大模型的 token 消...

Nacos 发布 MCP Registry，实现存量应用接口“0改动”升级到 MCP 协议

阿里云云原生

4 月 2 日

阅读 11 分钟

570

MCP 的发展速度之快，似乎超出了大部分人的想象。今年2月，Cursor、Windsurf、Cline 均开始引入 MCP，近日 OpenAI 宣布支持 MCP，国内百度地图、高德地图陆续发布 MCP Server，还有一众非常活跃的提供 MCP 托管和中间件服务的供应商，MCP 生态正呈现越加丰富和成熟的发展态势。

通义灵码 Rules 来了：个性化代码生成，对抗模型幻觉

阿里云云原生

4 月 2 日

阅读 3 分钟

391

简介：通义灵码又上新外挂啦，Project Rules来了。当模型生成代码不精准，试下通义灵码 Rules，对抗模型幻觉，硬控 AI 根据你的代码风格和偏好生成代码和回复。

Higress 开源 Remote MCP Server 托管方案，并将上线 MCP 市场

阿里云云原生

4 月 2 日

阅读 6 分钟

645

导读：MCP Server 的实施存在着诸多挑战，特别是在认证授权、服务可靠性和可观测性方面，Higress 作为 AI 原生的 API 网关，提供了完整的开源 MCP Server 托管解决方案，实现存量 API 到 MCP 的协议转换。即将上线的 MCP 市场，将大幅降低开发者构建 MCP Server 的时间和人力成本。

首发，Higress AI 网关率先支持 QwQ-32B，推理成本可再降 90%

阿里云云原生

4 月 2 日

阅读 8 分钟

356

在各类基准测试中，拥有 320 亿参数的 QwQ 模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）的 DeepSeek-R1 媲美。这意味着：

基于阿里云可观测产品构建企业级告警体系的通用路径与最佳实践

阿里云云原生

4 月 2 日

阅读 16 分钟

447

任何连续稳定运行的生产系统都离不开有效的监控与报警机制。通过监控，我们可以实时掌握系统和业务的运行状态；而报警则帮助我们及时发现并响应监控指标及业务中的异常情况。

如何在 IDE 里使用 DeepSeek？

阿里云云原生

4 月 2 日

阅读 1 分钟

338

近期，阿里云百炼平台重磅推出 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款模型，进一步丰富其 AI 模型矩阵。与此同时，通义灵码也紧跟步伐，全新上线模型选择功能，支持基于百炼的 DeepSeek-V3 和 DeepSeek-R1 满血版671B模型，为 AI 编程领域注入新活力。

SLS 重磅升级：超大规模数据实现完全精确分析

阿里云云原生

4 月 2 日

阅读 6 分钟

371

在亿级日志分析中，你是否遇到过结果不精确导致误判的困扰？多次查询，仍然结果不精确，怎么办？别担心，阿里云 SLS 全新推出「SQL 完全精确」模式，如何在超大规模数据下确保分析结果零误差？3 分钟解锁关键能力！

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

阿里云云原生

4 月 2 日

阅读 13 分钟

540

作者：夏冬，Spring AI Alibaba ContributorRAG 简介什么是 RAG（检索增强生成）RAG（Retrieval Augmented Generation，检索增强生成）是一种结合信息检索和文本生成的技术范式。🌟 核心设计理念RAG 技术就像给 AI 装上了「实时百科大脑」，通过先查资料后回答的机制，让 AI 摆脱传统模型的“知识遗忘”困境。🛠️ 四大核心步...

通义灵码助力技术求职：如何成为笔试面试冲刺的“超级助手”

阿里云云原生

4 月 1 日

阅读 4 分钟

387

在技术岗位竞争日益激烈的当下，求职季的备战已不仅是知识储备的较量，更是效率与实战能力的比拼。面对海量面试题、复杂算法挑战及快速迭代的技术框架，开发者亟需高效工具辅助突破瓶颈。阿里云推出的智能编码工具通义灵码，凭借其代码生成、优化及智能问答等核心能力，正成为开发者备战求职季的“超级助手”。

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

阿里云云原生

4 月 1 日

阅读 5 分钟

505

Wiz Research 发现了一个属于 DeepSeek 的公开可访问的 ClickHouse 数据库，该数据库允许完全访问并控制数据库操作，包括访问内部数据。泄露的信息包括超过一百万条日志流，其中包含聊天记录、密钥、后端详情和其他高度敏感的信息。Wiz Research 团队迅速且负责任地向 DeepSeek 报告了这一问题，DeepSeek 随即快速修复了...

钉钉 + AI 网关给 DeepSeek 办入职

阿里云云原生

4 月 1 日

阅读 6 分钟

361

通过 Open-WebUI 在企业内部部署一套 DeepSeek 只是第一步，给 DeepSeek 办理入职，在钉钉等企业通讯工具上和 DeepSeek 对话才是真时尚。

云原生 Kafka 问卷调研启动，你的声音很重要！参与赢精美礼品！

阿里云云原生

4 月 1 日

阅读 1 分钟

462

Apache Kafka 作为高吞吐的分布式消息系统，支持实时数据采集、传输、存储及处理，广泛应用于日志收集、监控数据聚合、流式数据处理、在线和离线分析等场景，是大数据生态的核心组件。然而，随着云计算的快速发展，传统 Kafka 架构在云环境中的局限性日益凸显。

使用 Ollama 本地模型与 Spring AI Alibaba 的强强结合，打造下一代 RAG 应用

阿里云云原生

4 月 1 日

阅读 10 分钟

479

作者：牧生Spring AI Alibaba RAG Example 示例项目源码地址：[链接]RAG 应用架构概述1.1 核心组件Spring AI：Spring 生态的 Java AI 开发框架，提供统一 API 接入大模型、向量数据库等 AI 基础设施。Ollama：本地大模型运行引擎，大模型时代的 Docker，支持快速体验部署大模型。Spring AI Alibaba：Spring AI 增强，集...

智能运维，由你定义：SAE自定义日志与监控解决方案

阿里云云原生

4 月 1 日

阅读 5 分钟

483

SAE【1】（Serverless 应用引擎）是一个全托管、免运维、高弹性的通用 PaaS 平台，实现了微服务应用、定时任务的 Serverless 化。产品初衷是将底层 Kubernetes 复杂度予以屏蔽，降低用户理解成本和使用门槛。用户并不感知底层 Infra，只需聚焦于核心的业务逻辑开发，而应用生命周期管理，微服务管理，日志，监控等功能交...

用户说：10分钟用通义灵码搞定“今天穿什么”！打开爽文世界……

阿里云云原生

3 月 31 日

阅读 4 分钟

428

作为一个本硕都出身于“教育技术学”这样一个极典型交叉学科的“半吊子程序员”，我一直处于一种尴尬的境地是，懂一些原理、需要一些开发，然而就是不爱敲代码！不久前参加了通义灵码和DataWhale在浙大举办的AI+X高校行活动，我第一次用上通义灵码，体会到一种“思维直通代码”的震撼和爽感！到现在为止已经使用通义灵码近半个...

通义灵码 Rules 来了：个性化代码生成，对抗模型幻觉

阿里云云原生

3 月 31 日

阅读 3 分钟

402

通义灵码又上新外挂啦，Project Rules来了。当模型生成代码不精准，试下通义灵码 Rules，对抗模型幻觉，硬控 AI 根据你的代码风格和偏好生成代码和回复。

API 安全之认证鉴权

阿里云云原生

3 月 31 日

阅读 17 分钟

534

API 作为企业的重要数字资源，在给企业带来巨大便利的同时也带来了新的安全问题，一旦被攻击可能导致数据泄漏重大安全问题，从而给企业的业务发展带来极大的安全风险。正是在这样的背景下，OpenAPI 规范中针对 API 安全做了明确的定义和引导，以便用户可以安全的管理自己的 API。以下为 OpenAPI 的定义：What is openAPI...

高效定位 Go 应用问题：Go 可观测性功能深度解析

阿里云云原生

3 月 31 日

阅读 11 分钟

360

自 2024 年 6 月 26 日，阿里云 ARMS 团队正式推出面向 Go 应用的可观测性监控功能以来，我们与程序语言及编译器团队携手并进，持续深耕技术优化与功能拓展。这一创新性的解决方案旨在为开发者提供更为全面、深入且高效的应用性能监控体验，助力企业在数字化转型中实现卓越的系统稳定性与性能表现。

大模型应用联网搜索：重塑智能时代的交互与决策

阿里云云原生

3 月 30 日

阅读 4 分钟

552

在人工智能技术的浪潮中，大模型的性能比拼持续升温。DeepSeek-R1 凭借强大的推理能力席卷全球，通义千问 QwQ 的开源则为行业注入了新的活力。然而，一个关键问题浮出水面：无论是 DeepSeek-R1（自行部署时）还是阿里云最新的 QwQ（当前阶段使用 API 调用），均暂未支持【联网搜索】能力。这意味着，这些模型的知识边...

极速启动，SAE 弹性加速全面解读

阿里云云原生

3 月 30 日

阅读 5 分钟

504

在当今快速发展的云计算时代，业务的稳定性和响应速度成为了企业竞争力的重要标志。无论是应对突发流量还是确保服务的高可用性，快速而灵活的扩展能力都是关键所在。然而，传统的扩展方式往往难以满足现代应用对极致弹性的需求——尤其是在启动速度和资源利用效率方面。

帮你整理好了，AI 网关的 8 个常见应用场景

阿里云云原生

3 月 29 日

阅读 5 分钟

542

之前我们分享过《AI 网关需要具备的 10 大基本能力》，属于供应者视角，今天我们从消费者视角介绍 AI 网关的 8 个常见应用场景。由于目前大部分企业部署大模型主要是内部自用，因此本文列举的应用场景大部分来自自用需求，对外提供服务，在需求颗粒度和程度上会更加依赖 AI 网关。

阿里云下一代可观测时序引擎-MetricStore 2.0

阿里云云原生

3 月 29 日

阅读 11 分钟

465

作为可观测场景使用频度最高的数据类型，Metrics 时序数据在可观测领域一直占有着重要地位，无论是从全局视角来观测系统整体状态，还是从大范围数据中定位某一个异常的位置，Metrics 数据总是处在整个可观测流程的第一步。在基础设施、云原生、中间件、IoT 设备、业务可观测、时序预测等众多场景，Metrics 都是被强依赖...

DeepSeek 给 API 网关上了一波热度

阿里云云原生

3 月 28 日

阅读 7 分钟

492

API 网关并不是一个新的概念，但 DeepSeek 的全民化趋势给 API 网关上了一波热度。本文将围绕 API 网关的上下游概念、演进历程和分类、核心能力、DeepSeek 如何接入 API 网关等方面，和大家一起更加立体的重新认识下 API 网关。

6

6