仅3步!即刻拥有 QwQ-32B,性能比肩全球最强开源模型

4 月 3 日
阅读 3 分钟
474
本文详细介绍如何将 QwQ-32B 开源模型部署到函数计算 FC(Function Compute),并通过云原生应用开发平台 CAP(Cloud Application Platform)实现 Ollama 和 Open WebUI 两个 FC 函数的部署。具体来说,Ollama 负责托管 QwQ-32B-GGUF 模型,而 Open WebUI 则用于提供用户界面,支持与模型的交互。

突破极限: 高负载场景下的单机300M多行正则日志采集不是梦

4 月 2 日
阅读 9 分钟
504
在当今数字化时代,日志数据已成为企业 IT 运营和业务分析的关键资源。然而,随着业务规模的扩大和系统复杂度的提升,日志数据的体量呈现爆发式增长,给日志采集和处理系统带来了巨大挑战。最近,我们遇到了一个典型案例,充分体现了当前日志服务采集在高负载场景下面临的困境,以下为客户现状:

Java版Manus实现来了,Spring AI Alibaba发布开源OpenManus实现

4 月 2 日
阅读 2 分钟
570
此次官方发布的 Spring AI Alibaba OpenManus 实现,包含完整的多智能体任务规划、思考与执行流程,可以让开发者体验 Java 版本的多智能体效果。它能够根据用户的问题进行分析,操作浏览器,执行代码等来完成复杂任务等。

当实时消费遇到 SPL:让数据处理更高效、简单

4 月 2 日
阅读 5 分钟
361
SLS 对实时消费进行了功能升级,推出了 基于 SPL 的规则消费功能。在实时消费过程中,用户只需通过简单的 SPL 配置即可完成服务端的数据清洗和预处理操作。通过SPL消费可以将客户端复杂的业务逻辑“左移”到服务端,从而大幅降低了客户端的复杂性和计算开销。

Higress.ai 站点全新发布,轻松解锁 AI 新能力,开启全球服务!

4 月 2 日
阅读 4 分钟
510
随着大模型技术的快速发展,AI 应用的工程化对底层基础设施提出了诸多需求,尤其是工程化过程中在安全、效率、性能等方面提出了更高的诉求。其中,AI 网关是非常重要的 AI 基础设施组件之一。

直播预约|ApsaraMQ x Confluent 云原生 Kafka 线上沙龙

4 月 2 日
阅读 1 分钟
353
云消息队列 Kafka 版是基于 Apache Kafka 构建的全托管服务,依托于阿里云强大的基础设施,对 Apache Kafka 进行了深度重构,通过存算分离架构、高弹性扩展、云服务深度集成等优化,致力于打造更经济、更稳定、更弹性的云原生 Kafka 产品,助力企业在数字化与智能化转型中,实现业务的稳定增长与创新突破。同时,阿里云...

大模型 Token 的消耗可能是一笔糊涂账

4 月 2 日
阅读 5 分钟
402
经典的 Web 应用,例如电商、游戏、出行、新能源、教育和医疗等,CPU 的消耗是可控的,和应用的在线人数和登陆时长成正相关,如果计算资源突增,可能是运营团队在做活动,也可能是预期外的突发流量,通过服务器弹性扩容后,稳定一段时间就会缩容到平时的状态,后端所消耗的资源是可追踪、可管控的。但大模型的 token 消...

Nacos 发布 MCP Registry,实现存量应用接口“0改动”升级到 MCP 协议

4 月 2 日
阅读 11 分钟
570
MCP 的发展速度之快,似乎超出了大部分人的想象。今年2月,Cursor、Windsurf、Cline 均开始引入 MCP,近日 OpenAI 宣布支持 MCP,国内百度地图、高德地图陆续发布 MCP Server,还有一众非常活跃的提供 MCP 托管和中间件服务的供应商,MCP 生态正呈现越加丰富和成熟的发展态势。

通义灵码 Rules 来了:个性化代码生成,对抗模型幻觉

4 月 2 日
阅读 3 分钟
391
简介:  通义灵码又上新外挂啦,Project Rules来了。当模型生成代码不精准,试下通义灵码 Rules,对抗模型幻觉,硬控 AI 根据你的代码风格和偏好生成代码和回复。

Higress 开源 Remote MCP Server 托管方案,并将上线 MCP 市场

4 月 2 日
阅读 6 分钟
645
导读:MCP Server 的实施存在着诸多挑战,特别是在认证授权、服务可靠性和可观测性方面,Higress 作为 AI 原生的 API 网关,提供了完整的开源 MCP Server 托管解决方案,实现存量 API 到 MCP 的协议转换。即将上线的 MCP 市场,将大幅降低开发者构建 MCP Server 的时间和人力成本。

首发,Higress AI 网关率先支持 QwQ-32B,推理成本可再降 90%

4 月 2 日
阅读 8 分钟
356
在各类基准测试中,拥有 320 亿参数的 QwQ 模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。这意味着:

基于阿里云可观测产品构建企业级告警体系的通用路径与最佳实践

4 月 2 日
阅读 16 分钟
447
任何连续稳定运行的生产系统都离不开有效的监控与报警机制。通过监控,我们可以实时掌握系统和业务的运行状态;而报警则帮助我们及时发现并响应监控指标及业务中的异常情况。

如何在 IDE 里使用 DeepSeek?

4 月 2 日
阅读 1 分钟
338
近期,阿里云百炼平台重磅推出 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款模型,进一步丰富其 AI 模型矩阵。与此同时,通义灵码也紧跟步伐,全新上线模型选择功能,支持基于百炼的 DeepSeek-V3 和 DeepSeek-R1 满血版671B模型,为 AI 编程领域注入新活力。

SLS 重磅升级:超大规模数据实现完全精确分析

4 月 2 日
阅读 6 分钟
371
在亿级日志分析中,你是否遇到过结果不精确导致误判的困扰?多次查询,仍然结果不精确,怎么办? 别担心,阿里云 SLS 全新推出「SQL 完全精确」模式,如何在超大规模数据下确保分析结果零误差?3 分钟解锁关键能力!

RAG 调优指南:Spring AI Alibaba 模块化 RAG 原理与使用

4 月 2 日
阅读 13 分钟
540
作者:夏冬,Spring AI Alibaba ContributorRAG 简介什么是 RAG(检索增强生成)RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和文本生成的技术范式。🌟 核心设计理念RAG 技术就像给 AI 装上了「实时百科大脑」,通过先查资料后回答的机制,让 AI 摆脱传统模型的“知识遗忘”困境。🛠️ 四大核心步...

通义灵码助力技术求职:如何成为笔试面试冲刺的“超级助手”

4 月 1 日
阅读 4 分钟
387
在技术岗位竞争日益激烈的当下,求职季的备战已不仅是知识储备的较量,更是效率与实战能力的比拼。面对海量面试题、复杂算法挑战及快速迭代的技术框架,开发者亟需高效工具辅助突破瓶颈。阿里云推出的智能编码工具通义灵码,凭借其代码生成、优化及智能问答等核心能力,正成为开发者备战求职季的“超级助手”。

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

4 月 1 日
阅读 5 分钟
505
Wiz Research 发现了一个属于 DeepSeek 的公开可访问的 ClickHouse 数据库,该数据库允许完全访问并控制数据库操作,包括访问内部数据。泄露的信息包括超过一百万条日志流,其中包含聊天记录、密钥、后端详情和其他高度敏感的信息。Wiz Research 团队迅速且负责任地向 DeepSeek 报告了这一问题,DeepSeek 随即快速修复了...

钉钉 + AI 网关给 DeepSeek 办入职

4 月 1 日
阅读 6 分钟
361
通过 Open-WebUI 在企业内部部署一套 DeepSeek 只是第一步,给 DeepSeek 办理入职,在钉钉等企业通讯工具上和 DeepSeek 对话才是真时尚。

云原生 Kafka 问卷调研启动,你的声音很重要!参与赢精美礼品!

4 月 1 日
阅读 1 分钟
462
Apache Kafka 作为高吞吐的分布式消息系统,支持实时数据采集、传输、存储及处理,广泛应用于日志收集、监控数据聚合、流式数据处理、在线和离线分析等场景,是大数据生态的核心组件。然而,随着云计算的快速发展,传统 Kafka 架构在云环境中的局限性日益凸显。

使用 Ollama 本地模型与 Spring AI Alibaba 的强强结合,打造下一代 RAG 应用

4 月 1 日
阅读 10 分钟
479
作者:牧生Spring AI Alibaba RAG Example 示例项目源码地址:[链接]RAG 应用架构概述1.1 核心组件Spring AI:Spring 生态的 Java AI 开发框架,提供统一 API 接入大模型、向量数据库等 AI 基础设施。Ollama:本地大模型运行引擎,大模型时代的 Docker,支持快速体验部署大模型。Spring AI Alibaba:Spring AI 增强,集...

智能运维,由你定义:SAE自定义日志与监控解决方案

4 月 1 日
阅读 5 分钟
483
SAE【1】(Serverless 应用引擎)是一个全托管、免运维、高弹性的通用 PaaS 平台,实现了微服务应用、定时任务的 Serverless 化。产品初衷是将底层 Kubernetes 复杂度予以屏蔽,降低用户理解成本和使用门槛。用户并不感知底层 Infra,只需聚焦于核心的业务逻辑开发,而应用生命周期管理,微服务管理,日志,监控等功能交...

用户说:10分钟用通义灵码搞定“今天穿什么”!打开爽文世界……

3 月 31 日
阅读 4 分钟
428
作为一个本硕都出身于“教育技术学”这样一个极典型交叉学科的“半吊子程序员”,我一直处于一种尴尬的境地是,懂一些原理、需要一些开发,然而就是不爱敲代码!不久前参加了通义灵码和DataWhale在浙大举办的AI+X高校行活动,我第一次用上通义灵码,体会到一种“思维直通代码”的震撼和爽感!到现在为止已经使用通义灵码近半个...

通义灵码 Rules 来了:个性化代码生成,对抗模型幻觉

3 月 31 日
阅读 3 分钟
402
通义灵码又上新外挂啦,Project Rules来了。当模型生成代码不精准,试下通义灵码 Rules,对抗模型幻觉,硬控 AI 根据你的代码风格和偏好生成代码和回复。

API 安全之认证鉴权

3 月 31 日
阅读 17 分钟
534
API 作为企业的重要数字资源,在给企业带来巨大便利的同时也带来了新的安全问题,一旦被攻击可能导致数据泄漏重大安全问题,从而给企业的业务发展带来极大的安全风险。正是在这样的背景下,OpenAPI 规范中针对 API 安全做了明确的定义和引导,以便用户可以安全的管理自己的 API。以下为 OpenAPI 的定义:What is openAPI...

高效定位 Go 应用问题:Go 可观测性功能深度解析

3 月 31 日
阅读 11 分钟
360
自 2024 年 6 月 26 日,阿里云 ARMS 团队正式推出面向 Go 应用的可观测性监控功能以来,我们与程序语言及编译器团队携手并进,持续深耕技术优化与功能拓展。这一创新性的解决方案旨在为开发者提供更为全面、深入且高效的应用性能监控体验,助力企业在数字化转型中实现卓越的系统稳定性与性能表现。

大模型应用联网搜索:重塑智能时代的交互与决策

3 月 30 日
阅读 4 分钟
552
在人工智能技术的浪潮中,大模型的性能比拼持续升温。DeepSeek-R1 凭借强大的推理能力席卷全球,通义千问 QwQ 的开源则为行业注入了新的活力。然而,一个关键问题浮出水面:无论是 DeepSeek-R1(自行部署时)还是阿里云最新的 QwQ(当前阶段使用 API 调用),均暂未支持 【联网搜索】 能力。这意味着,这些模型的知识边...

极速启动,SAE 弹性加速全面解读

3 月 30 日
阅读 5 分钟
504
在当今快速发展的云计算时代,业务的稳定性和响应速度成为了企业竞争力的重要标志。无论是应对突发流量还是确保服务的高可用性,快速而灵活的扩展能力都是关键所在。然而,传统的扩展方式往往难以满足现代应用对极致弹性的需求——尤其是在启动速度和资源利用效率方面。

帮你整理好了,AI 网关的 8 个常见应用场景

3 月 29 日
阅读 5 分钟
542
之前我们分享过《AI 网关需要具备的 10 大基本能力》,属于供应者视角,今天我们从消费者视角介绍 AI 网关的 8 个常见应用场景。由于目前大部分企业部署大模型主要是内部自用,因此本文列举的应用场景大部分来自自用需求,对外提供服务,在需求颗粒度和程度上会更加依赖 AI 网关。

阿里云下一代可观测时序引擎-MetricStore 2.0

3 月 29 日
阅读 11 分钟
465
作为可观测场景使用频度最高的数据类型,Metrics 时序数据在可观测领域一直占有着重要地位,无论是从全局视角来观测系统整体状态,还是从大范围数据中定位某一个异常的位置,Metrics 数据总是处在整个可观测流程的第一步。在基础设施、云原生、中间件、IoT 设备、业务可观测、时序预测等众多场景,Metrics 都是被强依赖...

DeepSeek 给 API 网关上了一波热度

3 月 28 日
阅读 7 分钟
492
API 网关并不是一个新的概念,但 DeepSeek 的全民化趋势给 API 网关上了一波热度。本文将围绕 API 网关的上下游概念、演进历程和分类、核心能力、DeepSeek 如何接入 API 网关等方面,和大家一起更加立体的重新认识下 API 网关。