大数据下大批量随机键值的查询

2020-03-03
阅读 3 分钟
1k
【摘要】键值查询是很常见的查询场景,在数据表上建有索引后,即使表中数据记录数巨大(几亿甚至几十亿行),用键值查询出单条记录也会很快,因为建立索引后的复杂度只有 logN 次,10 亿行数据也只要比较 30 次(10 亿约等于 2^30),在现代计算机上也只需要数十毫秒而已。不过,如果需要查询的键值很多,比如多达几千甚...

用集算器更新数据库的技巧

2019-06-14
阅读 2 分钟
807
比如,source和target是两个不同的数据源,callrecordA是source中的物理表,有1万条记录,callrecordB是target中的物理表,无记录,现在需要将callrecordA中的数据同步到callrecordB中。

用集算器更新数据库的技巧

2019-04-28
阅读 2 分钟
795
比如,source和target是两个不同的数据源,callrecordA是source中的物理表,有1万条记录,callrecordB是target中的物理表,无记录,现在需要将callrecordA中的数据同步到callrecordB中。

大主子表关联的性能优化方法

2019-02-18
阅读 7 分钟
2.2k
【摘要】主子表是数据库最常见的关联关系之一,最典型的包括合同和合同条款、订单和订单明细、保险保单和保单明细、银行账户和账户流水、电商用户和订单、电信账户和计费清单或流量详单。当主子表的数据量较大时,关联计算的性能将急剧降低,在增加服务器负载的同时严重影响用户体验。作为面向过程的结构化数据计算语言...

优化体系结构 - 数据外置减少中间表

2019-02-18
阅读 1 分钟
1.3k
【摘要】由于数据量或计算复杂度原因,经常需要在数据库中创建中间表,但中间表会带来很多问题!若采用专业的数据计算引擎,又会带来怎样的好处呢?去乾学院看个究竟吧!优化体系结构 - 数据外置减少中间表

体系结构方案 - 跨库数据运算

2019-01-23
阅读 1 分钟
1k
【摘要】存在问题:跨库的数据汇总运算开发复杂、效率低。产生的原因:单库的大表数据量巨大,条件限制又不能做分布式数据库,而大多数应用程序都严重依赖数据库的计算能力,但是跨库时数据库的计算能力常常不给力!解决方案:建议采用专业计算引擎,不依赖于数据库的计算能力。降低跨库数据运算的开发复杂度、提升开发...

为什么会有这么多中间表?

2018-12-13
阅读 3 分钟
1.3k
中间表是数据库中专门存放中间计算结果的数据表。报表系统中的中间表是普遍存在的。那么,这些中间表是如何出现的?为什么中间表会越来越多?中间表会给项目组带来什么样的困扰,如何解决这些困扰?这里我们就尝试探讨一下这个问题。

轻量级可嵌入多维分析后台

2018-11-28
阅读 10 分钟
1.4k
但是,这三种选择都有各自的问题。普通数据库一般都是行式存储,很难获得多维分析希望的高性能,只适用较小数据量。专业数据仓库有不少是列式存储的,性能问题不大,但是价格都比较昂贵,建设、扩展和维护成本也都非常高。BI 系统自带的数据源都比较封闭,只能为自家的 BI 前端提供支持,无法为多个不同厂家的前端提供数...

用计算路由的方法优化BI后台性能

2018-11-27
阅读 15 分钟
1.4k
BI 系统的常见结构是:前端是 BI 应用,负责多维分析的用户操作和结果呈现;后台是数据库 / 数据仓库,负责数据计算和存储。前端和后台之间用 SQL 作为接口。

跨库数据表的运算

2018-11-13
阅读 12 分钟
2.2k
跨库数据表的运算,一直都是一个说难不算太难,说简单却又不是很简单的、总之是一个麻烦的事。大量的、散布在不同数据库中的数据表们,明明感觉要把它们合并起来,再来个小小的计算,似乎也就那么回事……但真要做起来,需要这又忘了那的,却又不像仅仅就那么回事?        想要给这些小麻烦们,来一个快刀斩乱麻式的、嘁...

跨库多维分析后台的实现

2018-11-09
阅读 6 分钟
1.4k
例如:从性能和成本考虑,往往会限制生产库的容量,同时将历史数据分库存放,由ETL定期把生产库中新产生的数据同步到历史库中,同步周期根据数据的生成量,可能是1天、一周或者一个月。如果多维分析系统仅仅连上历史库取数,那么用户就只能对历史数据做分析,也就是实现T+1、T+7、T+30的多维分析。如果想要实现T+0的实时...

轻松应对多层JSON数据计算与入库

2018-11-07
阅读 4 分钟
2.1k
JSON作为一种轻量级的数据交换格式,因其易于读写和交互的特点,已逐渐成为主流的数据类型之一。常见的编程语言大多都对 JSON 的读取与解析提供了接口,但是接下来如何把多层 JSON 数据经过筛选、计算并展开成二维数据,就需要开发人员去头疼了。本文就为大家分享一下如何利用集算器 SPL(结构化处理语言)轻松解决 JSON...