闲鱼如何建设技术舆情治理体系 (多图多代码)

2021-03-10
阅读 7 分钟
简介: 从日志、监控、性能检测几个方面建设了有日志可查、有数据可依的排查体系现状和问题闲鱼的舆情治理,依托阿里集团的设施建设,有以下能力:崩溃异常、性能在线聚合查询;本地日志:TLog;在线日志:埋点日志(t+1)和用户行为日志(路径和请求)但在应对舆情治理方面仍存在较多的问题:有相当一部分闪退、黑屏、...

稳定性保障6步走:高可用系统大促作战指南!

2021-03-10
阅读 8 分钟
简介: 年年有大促,大家对于大促稳定性保障这个词都不陌生,业务场景尽管各不相同,“套路”往往殊路同归,全链路压测、容量评估、限流、紧急预案等,来来去去总少不了那么几板斧。跳出这些“套路”,回到问题的本质,我们为什么要按照这些策略来做?除了口口相传的历史经验,我们还能做些什么?又有什么理论依据?

每次都需要解释大量指令?使用 PolarDB-X 向量化引擎

2021-03-10
阅读 4 分钟
PolarDB-X是阿里巴巴自研的云原生分布式数据库,采用了计算-存储分离的架构,其中计算节点承担着大量的表达式计算任务。这些表达式计算涉及到SQL执行的各个环节,对性能有着重要的影响。为此PolarDB-X引入向量化执行引擎,为表达式计算带来了几十倍的性能提升。

如何通过 Serverless 提高 Java 微服务治理效率?

2021-03-10
阅读 6 分钟
简介: 在业务初期,因人手有限,想要快速开发并上线产品,很多团队使用单体的架构来开发。但是随着公司的发展,会不断往系统里面添加新的业务功能,系统越来越庞大,需求不断增加,越来越多的人也会加入到开发团队,代码库也会增速的膨胀,慢慢的单体应用变得越来越臃肿,可维护性和灵活性逐渐降低,维护成本越来越高。

从MVC到云原生:CBU研发体系演进之路

2021-03-10
阅读 10 分钟
CBU作为集团内最早成立的几个BU之一,有着多年丰富的业务沉淀,而CBU的技术也伴随着业务一起不断地演进和成长着。从PC时代的WebX到如今的Serverless,CBU的研发体系经历了多次变革,在不同的阶段中有着不同的特点。笔者所在的团队近年来一直在负责前台场景研发体系升级相关的工作,在这期间也对过往模式的演变进行了大量...

监控最佳实践--redis及业务接口

2021-03-09
阅读 4 分钟
简介: 监控最佳实践--redis及业务接口背景======1.1 问题2020-12-04,客户侧redis集群版监控DB0 CPU突增至100%,导致数据库无法正常服务,经排查客户侧业务上存在2M左右的大key导致DB0阻塞。并且客户侧使用的集群连接方式为默认proxy模式,如下图所示,DB0阻塞导致其他节点也无法正常服务;处理办法:客户侧配合切断大k...

基于Serverless的云原生转型实践

2021-03-09
阅读 12 分钟
简介: 新一代的技术架构是什么?如何变革?是很多互联网企业面临的问题。而云原生架构则是这个问题最好的答案,因为云原生架构对云计算服务方式与互联网架构进行整体性升级,深刻改变着整个商业世界的 IT 根基。

SAE助力「海底小纵队学英语」全面拥抱Serverless,节省25%以上成本

2021-03-09
阅读 1 分钟
简介: 阿里云Serveless应用引擎SAE 具备免运维IaaS、按需使用、按量计费、低门槛服务应用上云,并且支持多种语言和高弹性能力等特点,刚好完美解决了客户长期以来运维复杂、资源利用率不高、开发迭代效率低等问题。

阿里云AHAS Chaos:应用及业务高可用提升工具平台之故障演练

2021-03-09
阅读 3 分钟
应用高可用服务(Application High Availability Service)是阿里云一款专注于提高应用及业务高可用的工具平台,目前主要提供应用架构探测感知、故障注入式高可用能力评测和流控降级高可用防护三大核心能力,通过各自的工具模块可以快速低成本地在营销活动场景、业务核心场景全面提升业务稳定性和韧性。

浅谈分库分表那些事儿

2021-03-09
阅读 9 分钟
简介: 本文主要阐述在分库分表改造过程中需要考虑的因素以及对应的解法,还有踩过的那些坑。本文适合阅读群众:需要从单库单表改造为多库多表的新手。本文主要阐述在分库分表改造过程中需要考虑的因素以及对应的解法,还有踩过的那些坑。一 前言我们既然要做分库分表,那总要有个做事的动机。那么,在动手之前,首先就...

基于 Wasm 和 ORAS 简化扩展服务网格功能

2021-03-08
阅读 9 分钟
简介: 本文将介绍如何使用 ORAS 客户端将具有允许的媒体类型的 Wasm 模块推送到 ACR 注册库(一个 OCI 兼容的注册库)中,然后通过 ASM 控制器将 Wasm Filter 部署到指定工作负载对应的 Pod 中。Wasm Filter 部署中的所有步骤都使用声明方式,也就是说可以创建一个自定义资源 CRD 来描述 Wasm Filter 的部署。一旦该 CR...

AI在出行场景的应用实践:路线规划、ETA、动态事件挖掘…

2021-03-08
阅读 5 分钟
简介: 本文是#春招专栏#系列的第1篇,根据高德机器学习研发部负责人damon在AT技术讲坛所分享的《AI在出行领域的应用实践》的内容整理而成。

淘宝推荐、视频搜索背后的检索技术竟是它!深度揭秘达摩院向量检索引擎Proxima

2021-03-08
阅读 7 分钟
简介: 淘宝搜索推荐、视频搜索的背后使用了什么样的检索技术?非结构化数据检索,向量检索,以及多模态检索,它们到底解决了什么问题?今天由阿里巴巴达摩院的科学家从业务问题出发,抽丝剥茧,深度揭秘达摩院内部技术——向量检索引擎 Proxima,以及相关领域的现状、挑战和未来。

这可能是大型复杂项目下数据流的最佳实践

2021-03-08
阅读 5 分钟
在旧的 Done 项目中,代码复杂度高,已经到了“牵一发而动全身”,技术债极高的情况。由于旧代码“错综复杂”,导致实现一个简单的功能,都需要比正常时间多2~3倍的工作估时。就像下面这张图的情况一样。

MaxCompute在电商场景中如何进行漏斗模型分析

2021-03-08
阅读 4 分钟
漏斗模型其实是通过产品各项数据的转化率来判断产品运营情况的工具。转化漏斗则是通过各阶段数据的转化,来判断产品在哪一个环节出了问题,然后不断优化产品。电商漏斗模型,用户购买商品的路径,从浏览商品到支付订单的每一个环节的转化。本文将展示从用户「浏览-点击-购买」环节做漏斗分析及展示。

技术干货 | 阿里云数据库PostgreSQL 13大版本揭秘

2021-03-05
阅读 2 分钟
简介: 阿里云RDS PostgreSQL是一款兼容开源PostgreSQL的全托管云数据库产品,自2015年首次发布以来,根据用户需求不断升级迭代,已支持9.4、10、11、12等多个版本,覆盖了高可用版、基础版、只读实例等多种形态,数据存储覆盖了本地SSD、SSD云盘、 ESSD云盘等多种形态。最高配置可达104核,768G内存,32TB,100万IOPS。

ACK正式支持对基于Alibaba Cloud Linux操作系统的集群进行等保加固

2021-03-05
阅读 4 分钟
简介: 我们对基于Alibaba Cloud linux操作系统的ACK集群进行等保加固,意味着阿里云在云产品开发和交付的过程中将安全作为重要组成部分,将合规融入到产品的“血液”中,把安全植入产品的“骨髓”里,能够帮助有等保诉求的客户更加快速便捷的上云。

Serverless 极致弹性解构在线游戏行业痛点

2021-03-05
阅读 5 分钟
简介: 本文将通过剖析一个个具体的场景案例,以期望给相关的游戏开发同学带来共鸣,同时也希望能给非游戏行业的同学带来一些启发。一、前言1. 游戏客户上云关注点游戏行业是一个富有创意又竞争激烈的市场,被称为第九艺术。游戏客户上云主要关注以下 4 个方面:快速迭代,全球部署快速迭代是游戏行业的通用需求,包括开...

从no-code到low-code:企业级hpaPaaS的未来

2021-03-05
阅读 6 分钟
宜搭负责人骁勇给我举过一个例子,我们小时候逢年过节穿的衣服,都是去裁缝店选一下材料、量一下尺寸,等个半个来月,讨回来就可以穿了,衣服合身又喜欢。镜头切回今天,我们只需要在天猫、淘宝上看看图片、选择合适的尺寸就可以下单了,第二天就可以穿上,偶尔一丝不合身,偶尔大街上撞衫,但我们并不在意,因为我们享...

我在阿里云做云开发平台

2021-03-05
阅读 6 分钟
各大云厂商今年在开发者阵地侧逐渐开始向“云”化开发发展,最为显著的产品就是Cloud IDE,催生出来的趋势就是云端开发。云开发现阶段尽管在各大公司内部无法作为日常开发工具普遍推广,但是在某些特定场景下Cloud IDE云开发是非常让人着迷的:

平台建设的7大问题:蚂蚁AI平台实践深度总结

2021-03-04
阅读 13 分钟
简介: 在支持蚂蚁几乎所有核心业务运行和发展的过程中,我们在平台建设、业务支持、平台运营、AI创新以及AI整体运营等各个方面做了很多尝试,有了不少的收获和感悟,在此分享给大家。

快手基于 Flink 的持续优化与实践

2021-03-04
阅读 5 分钟
第一部分是 Flink 稳定性的持续优化。该部分包括两个方面,第一个方面,主要介绍快手在 Flink Kafka Connector 方面做的一些高可用,是基于内部的双机房读或双机房写和一些容错的策略。第二部分关于 Flink 任务的故障恢复。我们在加速故障恢复方面做了一些优化工作。

基于 KubeVela 与 Kubernetes 打造“无限能力”的开放 PaaS

2021-03-04
阅读 7 分钟
简介: 本文整理自阿里云容器技术专家、OAM 规范主要制定者之一、KubeVela 作者和负责人孙健波(天元)在阿里云开发者社区“周二开源日”的直播分享,将剖析当前 Kubernetes 应用交付体系存在的问题详细介绍如何基于 OAM 和 KubeVela 体系赋能 PaaS,构建开放可扩展又易用的能力。

收藏!这些IDE使用技巧,你都知道吗

2021-03-04
阅读 12 分钟
简介: 欲善其事,先利其器。对于研发同学,在日常的开发工作中,我们与之打交道最多的便是编程的IDE。能否高效和灵活的使用IDE,将对我们的工作效率起着举足轻重的作用。

Kubernetes 稳定性保障手册 -- 极简版

2021-03-04
阅读 3 分钟
对于基于 Kubernetes 的云产品,稳定性保障已成为基本诉求,稳定性缺陷会给产品带来巨大的损失,如用户流失、用户信心下降、产品迭代速度变慢等。

基于 Flink SQL 构建流批一体的 ETL 数据集成

2021-03-03
阅读 11 分钟
本文整理自云邪、雪尽在 Flink Forward Asia 2020 的分享,该分享以 4 个章节来详细介绍如何利用 Flink SQL 构建流批一体的 ETL 数据集成, 文章的主要内容如下:

基础组件完善的今天,如何通过业务组件提效?

2021-03-03
阅读 10 分钟
简介: 无论是在前端刀耕火种的 jQuery/YUI 时代,还是到现在基于数据驱动 UI 的 React/Vue 时代,物料/组件一直是前端永恒的话题。基于大量重复逻辑的封装可以很显而易见地提升前端 UI 的构建效率,简单而直接,因此无论技术栈如何变化,物料工作都是排在各个前端团队的首要位置解决。

Serverless 2.0,鸡蛋还是银弹?

2021-03-03
阅读 7 分钟
从 2014 年 Serverless 冒头至今,已经有无数的勇士在前面探路,阿里、腾讯、亚马逊、百度、华为等都不断推出自己的云服务,想要在这一浪潮中分一杯羹。除了最早的亚马逊,国内的战争一直在不温不火地进行,除了抢占市场外,还在不断寻求新的解决方案,期待有朝一日,能够凭着新方案,吸引大波用户。

OpenYurt 如何 “0 侵入” 攻破云边融合难点

2021-03-03
阅读 9 分钟
简介: 随着 5G、IoT、直播、CDN 等行业和业务的发展,越来越多的算力和业务开始下沉到距离数据源或者终端用户更近的位置,以期获得很好的响应时间和成本,这是一种明显区别于传统中心模式的计算方式——边缘计算。

256变4096:分库分表扩容如何实现平滑数据迁移?

2021-03-02
阅读 6 分钟
2020年,笔者负责的一个高德打车弹外订单系统进行了一次扩分库分表和数据库迁移。该订单系统整体部署在阿里云上,服务使用阿里云ECS部署,数据库采用阿里云RDS,配置中心基于阿里云ACM自研,数据同步基于阿里云DTS自研以及自研分库分表组件、分布式ID组件等等。