每天,我们都会遇到一些没有答案的问题,比如:宇宙中有多少颗行星? 这个问题没有最终答案,毕竟,仅仅是我们所在的银河系就有60 亿颗类地行星。而在阿里云智能资深产品总监、阿里云存储产品负责人 Alex Chen看来,今天人类生产生活中所产生的数据就像浩瀚的宇宙:数据量大,且不断膨胀;隐藏着诸多难以预见的风险;同...
数据价值取决于对数据的洞察创新,通过结合开发应用实现数据价值最大化的释放。云计算是大数据的 IT 基础,海量、繁杂的大数据必须依托于云计算的分布式架构,二者相辅相成,云化渗透率提升将支撑大数据进一步提速。基于此,首届数据洞察创新挑战赛正式启动!本届大赛奖金池高达 20 万元,是由阿里云主办的面向广大开发...
猿辅导成立多年,早期是基于关系型的 MySQL 数据库来做数据的需求。随着业务的发展,多个服务在一个 DB 去做数据的汇总,以及一些微服务架构的产生,使得数据逐渐走向分裂,很难在 MySQL 里完成统一的数仓。 因此在 2014 年,公司开始了统一数仓的建设,采用的是比较成熟的 Hadoop体系。虽然是用 Hive、MapReduce 做离线...
简介: TDDL(Tabao Distributed Data Layer)是淘宝开源的一个用于访问数据库的中间件,集成了分库分表,主备,读写分离,权重调配,动态数据库配置等功能。本文以2007年TDDL初诞生时的视角,介绍TDDL是如何一步步设计成型的,希望能帮助同学们简单收获:常规数据库效率问题解决思路、TDDL框架设计基本思路以及分布式数据...