如何通过Dataphin构建数据中台新增100万用户?

2019-11-07
阅读 2 分钟
欢迎来到数据中台小讲堂!这一期我们来看看,作为阿里巴巴数据中台(OneData - OneModel、OneID、OneService)方法论的产品载体,Dataphin如何帮助传统零售企业实现数字化转型,并在短时间内新增100万用户?

深度 | 带领国产数据库走向世界,POLARDB底层逻辑是什么?

2019-10-28
阅读 8 分钟
阿里妹导读:在刚刚结束的乌镇世界互联网大会上,阿里云自主研发的POLARDB云原生数据库当选世界互联网领先科技成果,凭实力站上C位。这个”包管“了北京市每天800万人次的公交出行的下一代分布式数据库到底有多强大?我们请阿里云智能数据库事业部总经理鸣嵩跟大家一起聊聊。

BDS-HA:构建高可用、低延迟的HBase服务

2019-10-12
阅读 4 分钟
HBase可以支持百TB数据规模、数百万QPS压力下的毫秒响应,适用于大数据背景下的风控和推荐等在线场景。阿里云HBase服务了多家金融、广告、媒体类业务中的风控和推荐,持续的在高可用、低延迟、低成本方向上进行优化。目前单集群承诺可用性99.9%,SSD机型上可以做到请求毛刺99.5% < 50ms,以及新上线的表内冷热分离可...

使用EMR-Kafka Connect进行数据迁移

2019-07-30
阅读 2 分钟
流式处理中经常会遇到Kafka与其他系统进行数据同步或者Kafka集群间数据迁移的情景。使用EMR Kafka Connect可以方便快速的实现数据同步或者数据迁移。

基于Tablestore Tunnel的数据复制实战

2019-07-01
阅读 9 分钟
数据复制主要指通过互联的网络在多台机器上保存相同数据的副本,通过数据复制方案,人们通常希望达到以下目的:1)使数据在地理位置上更接近用户,进而降低访问延迟;2)当部分组件出现故障时,系统依旧可以继续工作,提高可用性;3)扩展至多台机器以同时提供数据访问服务,从而提升读吞吐量。如果复制的数据一成不变,...

拔掉数据库的电源会怎样?阿里云数据库新型灾备架构,让云端容灾有“备”无患

2019-06-10
阅读 4 分钟
拔掉数据库的电源会怎样? 假设我们拔掉数据库的电源会怎样? 在日前举行的阿里云“企业级”云灾备解决方案发布会上,阿里云智能技术战略总监陈绪就来了一场现场“断电”演示,拔掉了数据库的电源。 (直播回放:[链接]) 猜猜现场发生了什么? 数据丢失,业务瘫痪,企业资金受损? 上述情况统统没有出现!没有出现任何数据...

使用EMR Spark Relational Cache跨集群同步数据

2019-06-06
阅读 3 分钟
Relational Cache是EMR Spark支持的一个重要特性,主要通过对数据进行预组织和预计算加速数据分析,提供了类似传统数据仓库物化视图的功能。除了用于提升数据处理速度,Relational Cache还可以应用于其他很多场景,本文主要介绍如何使用Relational Cache跨集群同步数据表。通过统一的Data Lake管理所有数据是许多公司追...

蚂蚁金服面对亿级并发场景的组件体系设计

2019-05-21
阅读 10 分钟
作者:吕丹(凝睇),2011 年加入支付宝,先后负责了支付宝 Wap、alipass 卡券、SYNC 数据同步等项目,并参与了多次双十一、双十二、春节红包大促活动,在客户端基础服务方面有一定的项目实践经验与积累。目前负责蚂蚁金服移动开发平台 mPaaS 服务端组件体系优化与架构设计。

通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析

2019-04-02
阅读 3 分钟
通过DataWorks归档日志服务数据至MaxCompute 官方指导文档:[链接]但是会遇到大家在分区上或者DataWorks调度参数配置问题,具体拿到真实的case模拟如下: 创建数据源: 步骤1、进入数据集成,点击作业数据源,进入Tab页面。 步骤2、 点击右上角 新增数据源,选择消息队列 loghub。 步骤3、编辑LogHub数据源中的必填项,...