SF
数据仓库学习与分享
数据仓库学习与分享
注册登录
关注博客
注册登录
主页
关于
RSS
数据仓库(11)什么是大数据治理,数据治理的范围是哪些
张飞的猪
2023-04-09
阅读 2 分钟
1.1k
什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治?
数据仓库(10)数仓拉链表开发实例
张飞的猪
2022-11-10
阅读 2 分钟
878
维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录,通过拉链表可以很方便的还原出拉链时点的客户记录。
数据仓库(09)数仓缓慢变化维度数据的处理
张飞的猪
2022-09-26
阅读 2 分钟
1.1k
数据仓库的重要特点之一是反映历史变化,所以如何处理维度的变化是维度设计的重要工作之一。缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流逝发生缓慢的变化,与数据增长较为快速的事实表相比,维度变化相对缓慢。阴齿这个就叫做缓慢变化维。
数据仓库(08)数仓事实表和维度表技术
张飞的猪
2022-09-13
阅读 2 分钟
942
事实表,就是一个事实的集合。事实来自业务过程的度量,基本上以数量值表示。事实表行对应一个事实,一个事实对应一个物理可以观察的事件,例如,再零售事件中,销售数量与总额是数据事实,与销售事件不相关的度量不可以放在同一个事实表里面,如员工的工资。
数据仓库(07)数仓规范设计
张飞的猪
2022-08-17
阅读 2 分钟
730
所谓的规范的定义,简单理解,如果把数据当作货物,那就是货物的分类,以及对应相关的属性,比如生产日期,某个原料的含量等,我们可以把相近或者相同货物,按照一定的规律,放在一起,方便入库与出库,需要某个货物按照这些规律就可以,以比较快的速度拉取出来。
数据仓库(06)数仓分层设计
张飞的猪
2022-08-04
阅读 2 分钟
1.9k
目前主流的数据仓库分层大多为四层,也有五层的架构,这里介绍基本的四层架构。 分别为数据贴源层(ods)、数据仓库明细层(dw)、多维明细层(dws)和数据集市层(dm)。
数据仓库(05)数仓Kimball与Inmon架构的对比
张飞的猪
2022-06-21
阅读 2 分钟
990
数据仓库主要有四种架构,Kimball的DW/BI架构、独立数据集市架构、辐射状企业信息工厂Inmon架构、混合Inmon与Kimball架构。不过不管是那种架构,基本上都会使用到维度建模。
数据仓库(04)基于维度建模的数仓KimBall架构
张飞的猪
2022-05-30
阅读 1 分钟
858
基于维度建模的KimBall架构,将数据仓库划分为4个不同的部分。分别是操作型源系统、ETL系统、数据展现和商业智能应用,如下图。
数据仓库(03)数仓建模之星型模型与维度建模
张飞的猪
2022-05-18
阅读 2 分钟
974
维度建模是一种将数据结构化的逻辑设计方法,也是一种广泛应用的数仓建模方式,它将客观世界划分为度量和上下文。度量是常常是以数值形式出现,事实周围有上下文包围着,这种上下文被直观地分成独立的逻辑块,称之为维度。它与实体-关系建模有很大的区别,实体-关系建模是面向应用,遵循第三范式,以消除数...
数据仓库(02)数仓、大数据与传统数据库的区别
张飞的猪
2022-05-11
阅读 2 分钟
1.5k
我们这里先来说说今天要对比的三个主体,数据仓库、大数据、数据库,在详细说明之前,我们先来说说这三个百度百科上面的定义。
数据仓库(01)什么是数据仓库,数仓有什么特点
张飞的猪
2022-05-06
阅读 3 分钟
1.6k
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
1
2
(current)
上一页
2
(current)
下一页