预发部署时机器总是重启两次的“简单”排查

2023-10-18
阅读 8 分钟
前天同学反馈, 搜索业务的核心应用 magellan 在预发环境部署时总是重启两次,刚部署好,开始联调,突然又重启了,也导致老是被人抱怨搜索环境不稳定。

基于 Triple 实现 Web 移动端后端全面打通

2023-10-18
阅读 5 分钟
在我们正常开发微服务的时候,传统 RPC 服务可能在最底层。上层可能是浏览器、移动端、外界的服务器、自己的测试、curl 等等。我们可能会通过 Tomcat 这种外部服务器去组装我们的 RPC 层,也就是 BFF。或者我们没有 BFF,我们的 RPC 就是对外提供服务。但因为浏览器要访问,所以我们需要有一个网关,比如说 APISIX 或者 ...

浅谈交易链路中的一些设计原则&模式

2023-10-17
阅读 8 分钟
最近在读之前简单看过的书,其中一本就是《企业应用架构模式》,本想写一下读书笔记,但是写的时间是03年的,有些久远了,可能系统结构也翻天覆地,不一样了,摘抄出来感觉也很古老,共鸣没有那么大。不过当时读的时候的内心的宁静还是还是很令人眷恋的。转过头来,本人之前也对设计原则、模式等进行过学习,但是主要是...

深势科技基于 Serverless 容器为科研人员打造高效的开发平台

2023-10-17
阅读 4 分钟
以往科学家们的科研工作需要经过大量实验的重复验证、复杂数学计算,以及长年累月的不断试错和苦苦探索。云计算基础服务的发展和人工智能技术 AI 的兴起,也给科研领域带来了新转变。

茶百道全链路可观测实战

2023-10-17
阅读 6 分钟
茶百道是四川成都的本土茶饮连锁品牌,创立于 2008 年 。经过 15 年的发展,茶百道已成为餐饮标杆品牌,全国门店超 7000 家,遍布全国 31 个省市,实现中国大陆所有省份及各线级城市的全覆盖。2021 年 3 月 31 日,在成渝餐·饮峰会中,茶百道斩获“2021 成渝餐·饮标杆品牌奖”。2021 年 8 月,入选艾媒金榜(iiMedia Ranki...

基于阿里云服务网格流量泳道的全链路流量管理(一):严格模式流量泳道

2023-10-16
阅读 7 分钟
灰度发布是一种常见的对新版本应用服务的发布手段,其特点在于能够将流量在服务的稳定版本和灰度版本之间时刻切换,以帮助我们用更加可靠的方式实现服务的升级。在流量比例切换的过程中,我们可以逐步验证新版本服务的功能特性、可靠性等特性,一旦新版本服务不满足需求,还可以时刻将流量切回老版本,因此灰度发布也是...

政采云基于 Dubbo 的混合云数据跨网实践

2023-10-16
阅读 7 分钟
云岛中的“云”是指我们的云平台,云平台是我们公司自己部署的一套购物网站,技术上对应的是一套微服务框架。而“岛”呢,比如安徽或者山西它们都有自己的局域网,如果我们在它们那里也部署一套这个服务框架,就叫“岛”。

精进云原生 – Dubbo Kubernetes 最佳实践

2023-10-16
阅读 7 分钟
随着云原生的兴起,越来越多的应用选择基于 Kubernetes 进行部署,相关的 DevOps 等工具也应运而生。而 Dubbo 作为微服务体系的主流解决方案,如何开发面向 Kubernetes 部署和运维的微服务应用是很多开发者与架构师要解决的问题。本文将从开发、部署、监控、运维等多维度视角分析,详细的介绍如何基于 Dubbo 在Kubernete...

人力家:借助 Information Schema 合理治理费用

2023-10-13
阅读 5 分钟
人力家是由阿里钉钉和人力窝共同投资成立,帮助客户进入人力资源数字化,依靠产品技术创新驱动战略的互联网公司。公司主要提供包括人事管理、薪酬管理、社保管理、增值服务在内的人力资源SaaS服务,加速对人力资源领域赋能,实现人力资源新工作方式。目前已服务电子商务、零售服务等领域的多行业客户。

快速使用 Elasticsearch+PAI 部署 AI 大模型知识库对话

2023-10-11
阅读 9 分钟
阿里云检索分析服务 Elasticsearch 版是100%兼容开源的分布式检索、分析套件。提供 Elasticsearch、Kibana、Logstash、Beats 等开源全托管的产品服务能力。为结构化/非结构化数据提供低成本、高性能及可靠性的检索、分析平台级产品服务。具备读写分离、存算分离、弹性伸缩、智能化运维、免费的X-Pack高级商业特性等产品...

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上?

2023-10-11
阅读 3 分钟
随着ChatGPT 以及 Stable Diffusion,Midjourney 这些新生代 AIGC 应用的兴起,围绕AIGC应用的相关开发变得越来越广泛,有呈井喷之势,从长远看这波应用的爆发不仅仅是停留在形式之上,更是在各个领域产生实际的生产力价值,比如办公领域有copilot system 365,钉钉智能; 代码编程领域有 github copilot ,cursor ide; 文...

被报警大量骚扰?来看看治理方法论

2023-10-10
阅读 6 分钟
五月六月以来,蚂蚁开启监控治理主题,推进监控进一步完善,做到既能即时响应告警——五分钟响应三十分钟处理完毕,又能过滤降噪,避免处理疲劳。除了响应公司治理主题之外,小组内部告警的噪音也是一直积累的问题,这是由于随着项目和小组的发展,不可避免的使得配置的监控越来越多,累积的不健康监控增加,导致人均处理...

一文论重复性工作中如何培养匠心

2023-10-09
阅读 5 分钟
这两个词放在一起,是不是乍一看有点别扭?别扭点大概在于:匠心是公认的褒义词,而重复性工作虽然原本是中性词,但在互联网技术语境里,通常都是以技术解决问题、消灭重复性工作为目标,久而久之,重复性工作更像是个贬义词了。但是反过来想,匠心来自哪里?寿司之神的匠心,来自于数十年如一日的制作寿司,庖丁解牛的...

当尺度感知调制遇上 Transformer,会碰撞出怎样的火花?

2023-10-09
阅读 6 分钟
近年来,基于Transformer和CNN的视觉基础模型取得巨大成功。有许多研究进一步地将Transformer结构与CNN架构结合,设计出了更为高效的hybrid CNN-Transformer Network,但它们的精度仍然不尽如意。本文介绍了一种新的基础模型SMT(Scale-Aware Modulation Transformer),它以更低的参数量(params)和计算量(flops)取...

云原生场景下高可用架构的最佳实践

2023-10-08
阅读 19 分钟
随着云原生技术的快速发展以及在企业 IT 领域的深入应用,云原生场景下的高可用架构,对于企业服务的可用性、稳定性、安全性越发重要。通过合理的架构设计和云平台的技术支持,云原生高可用架构可以提供高可用性、弹性扩展性、简化运维管理、提升可靠性和安全性等方面的优势,为企业提供了更加可靠和高效的应用运行环境。

基于 Kubernetes 的 Serverless PaaS 稳定性建设万字总结

2023-10-08
阅读 11 分钟
数字经济的今天,云计算俨然已经作为基础设施融入到人们的日常生活中,稳定性作为云产品的基本要求,研发人员的技术底线,其不仅仅是文档里承诺的几个九的 SLA 数字,更是与客户切身利益乃至身家性命息息相关,稳定性压倒一切。本文将侧重于实际落地而非方法论,阐述云产品 SAE 业务侧稳定性实际建设过程中的经验和思考。

多场景 PAI-Diffusion 中文模型家族大升级,12个模型、2个工具全部开源

2023-10-07
阅读 4 分钟
在过去几年中,随着AI生成内容(AI Generated Content,AIGC)的快速发展,Stable Diffusion模型在该领域崭露头角。阿里云机器学习PAI团队为推动这一领域的发展,参考了Stable Diffusion的模型结构,结合中文语言的特点,通过大量对模型预训练数据的处理和过滤,以及训练过程的优化,提出了PAI-Diffusion中文文图生成模...

阿里云 PAI-灵骏大模型训练工具 Pai-Megatron-Patch 正式开源!

2023-10-07
阅读 13 分钟
Pai-Megatron-Patch工具是阿里云机器学习平台PAI算法团队研发,基于阿里云智算服务PAI-灵骏平台的大模型最佳实践解决方案配套工具,旨在帮助大模型开发者快速上手灵骏产品,完成大语言模型(LLM)的高效分布式训练,有监督指令微调,模型离线推理验证等完整大模型开发链路。该项目提供了业界主流开源大模型基于Megatron-...

三张搞定AI形象照,开启GPU即刻体验

2023-09-28
阅读 3 分钟
本文将为您演示如何使用GPU加计算巢来生成个人的数字写真。整个过程分为三步:第一步是开通FaceChain服务并创建实例;第二步是使用已开通的FaceChain服务进行训练;第三步是选择风格并生成个人的数字写真。在每一步中,都给出了具体的操作指引和注意事项。

Apache Dubbo 首个 Node.js 3.0-alpha 版本正式发布

2023-09-28
阅读 4 分钟
Apache Dubbo 是一款易用、高性能的 WEB 和 RPC 框架,同时为构建企业级微服务提供服务发现、流量治理、可观测、认证鉴权等能力、工具与最佳实践。经过近几年发展,Dubbo3 已在阿里巴巴集团各条业务线实现全面推广,成功取代运行多年的 HSF 框架,同时 Dubbo3 的多语言体系也有了快速发展,目前涵盖的多语言体系有

Grafana 10 新特性解读:体验与协作全面提升

2023-09-27
阅读 5 分钟
为了庆祝 Grafana 的 10 年里程碑,Grafana Labs 推出了 Grafana 10,这个具有纪念意义的版本强调增强用户体验,使各种开发人员更容易使用。Grafana v10.0.x 为开发者与企业展示卓越的新功能、可视化与协作能力,其中还包括:

统一观测丨使用 Prometheus 监控 SQL Server 最佳实践

2023-09-26
阅读 9 分钟
Microsoft SQL Server 是 Microsoft 推出的关系型数据库解决方案,支持企业 IT 环境中的各种事务处理、商业智能和分析应用程序。Microsoft SQL Server 是市场领先的数据库技术之一。

基于 EventBridge 轻松搭建消息集成应用

2023-09-26
阅读 6 分钟
本篇文章主要介绍基于阿里云 EventBridge 的消息集成能力,结合目前消息产品的需求热点,从能力范围到场景实战,对 EventBridge 的消息集成解决方案进行了概要的介绍。

全网最细 - 深度解析 Istio Ambient Mesh 流量路径

2023-09-26
阅读 15 分钟
Istio Ambient Mesh 是 Istio 社区的推出的将 Sidecar 的能力抽离至 ztunnel 和 waypoint 的全新架构,同时基于 iptables 和策略路由实现了该架构下的流量规则,目前网络上已经有些资料对这部分的实现进行了一定程度的剖析(比如 [链接] 推出的三篇系列文章),但仍然有很多细节尚没有任何文章提及。本文旨在对 Istio Am...

基于 ACK Fluid 的混合云优化数据访问(五):自动化跨区域中心数据分发

2023-09-25
阅读 7 分钟
前文回顾:本系列将介绍如何基于 ACK Fluid 支持和优化混合云的数据访问场景,相关文章请参考:《基于 ACK Fluid 的混合云优化数据访问(一):场景与架构》《基于 ACK Fluid 的混合云优化数据访问(二):搭建弹性计算实例与第三方存储的桥梁》《基于 ACK Fluid 的混合云优化数据访问(三):加速第三方存储的读访问,...

DataWorks 增强分析发布,一站式数据查询分析与可视化

2023-09-25
阅读 2 分钟
8月31日阿里云郑州峰会,阿里云行业解决方案研发部总经理曾震宇在主论坛飞天发布时刻重磅发布DataWorks与DataV-Card合作推出的AI增强分析产品,一站式完成从数据查询、分析、可视化、共享的完整链路,1分钟即可形成数据报告,帮助互联网、金融、政务等各个行业客户表达数据观点,讲好数据故事。

实时数仓 Hologres:推出计算组实例/支持JSON数据/向量计算+大模型等新能力

2023-09-25
阅读 6 分钟
阿里云ODPS系列产品以MaxCompute、DataWorks、Hologres为核心,致力于解决用户多元化数据的计算需求问题,实现存储、调度、元数据管理上的一体化架构融合,支撑交通、金融、科研、等多场景数据的高效处理,是目前国内最早自研、应用最为广泛的一体化大数据平台。

基于 ACK Fluid 的混合云优化数据访问(四):将第三方存储目录挂载到 Kubernetes,提升效率和标准化

2023-09-21
阅读 6 分钟
前文回顾:本系列将介绍如何基于 ACK Fluid 支持和优化混合云的数据访问场景,相关文章请参考:《基于 ACK Fluid 的混合云优化数据访问(一):场景与架构》《基于 ACK Fluid 的混合云优化数据访问(二):搭建弹性计算实例与第三方存储的桥梁》《基于 ACK Fluid 的混合云优化数据访问(三):加速第三方存储的读访问,...

做好这四步,服务端轻松成为全栈化人才

2023-09-21
阅读 10 分钟
软件开发里本没有服务端,分的细了就有了服务端。做为一个软件开发者,每个人都可以是全栈。看到“服务端全栈”这个词,不知道屏幕前的你现在脑子里想到的是什么问题。

十行代码让日志存储降低80%

2023-09-21
阅读 8 分钟
履约管理是一个面向物流商家的OMS工作台,自从初代目把架子搭起来之后,就没有继续投入了,后来一直是合作伙伴同学在负责日常维护和需求支撑。经过几年的野蛮生长,系统已经杂草丛生,乱象百出。再后来,甚至一度成为一块无主之地,走行业共建的方式来支持。对于一个不支持行业隔离的系统,行业共建意味这个系统将快速腐...