数据仓库 (DW) 是从多个来源收集和管理数据的过程,目的是使企业具备有价值的业务洞察力。数据仓库最常用于集成和分析来自不同来源的公司数据。数据仓库是为数据处理和报告而设计的 BI 系统的核心。

许多公司正在将他们的数据仓库转移到云端,因为本地数据仓库容易出现存储容量不灵活、技术问题以及由于硬件维护需求而导致的昂贵运营费用。

云数据仓库是在公共云上运行的托管数据库,用于分析、可扩展性和易用性。

使用基于云的数据仓库已成为常态,企业现在可以访问几乎无限的计算能力和存储空间。

图片

1、为什么使用云数据仓库

基于云的数据仓库使商业智能团队能够通过改进的访问、可扩展性和速度提供更快、更好的洞察力,使他们能够专注于运营业务,而不是管理大量的计算机。

1)安全

传统上,本地数据仓库被认为比云数据仓库更安全。但是,企业现在意识到云数据更安全且维护成本更低。

云数据不会分布在多个服务器上。因此,云安全专家可以创建和迭代精确的数据保护措施。此外,多因素认证等云加密技术使区域和资源之间的数据传输非常安全。最后,大多数云数据仓库都包括虚拟专用网络 (VPN),这进一步限制了数据泄露的危险。

2)数据访问

通过将数据存储在云上,企业可以为分析师提供来自各种来源的实时数据,使他们能够更快地进行最佳的分析效果。

3)可扩展性

扩展云数据仓库比扩展本地系统更快且成本更低,因为它不需要企业购买新硬件(并且可能会供应过多或不足),并且可以根据需要自动完成。

4)性能

与典型的本地数据仓库相比,在云数据仓库中可以更快地执行查询,从而降低成本。

5)成本

随着公司数据收集的增长,本地数据仓库变得更加昂贵。扩展业务智能程序会大大增加费用,因为本地计算和存储不能单独获取。

另一方面,数据仓库团队可以使用云数据仓库购买他们需要的计算能力和存储空间。此外,云数据仓库不需要网络、服务器机房或任何其他基础设施。

图片

2、云数据仓库的能力

每个大型公共云提供商都有自己的云数据仓库版本:BigQuery 由 Google 提供,Redshift 由 Amazon 提供,Azure SQL 数据仓库由 Microsoft 提供。

例如,Snowflake 有一个云选项,它通过在公共云上运行但独立维护的服务提供相同的功能。云供应商或数据仓库提供商为这些服务中的每一项提供以下开箱即用的功能:

  • 数据管理和存储:数据保存在基于云的文件系统中
  • 这个世界上没有“版本”或“软件更新”之类的东西
  • 容量管理:扩展(或收缩)企业的数据足迹很简单

3、选择云数据仓库服务的因素

1)体系结构

云数据仓库设计分为两组。许多传统的部署架构都是基于集群的,例如 Amazon Redshift 和 Azure SQL 数据仓库。集群云数据仓库通常是集群化的 Postgres 衍生产品,经过调整后可以作为云服务运行。

另一种无服务器设计是最近才出现的。Google BigQuery 和 Snowflake 就是很好的例子。相比之下,无服务器云数据仓库使数据库集群“不可见”或在多个客户之间共享。每种架构都有其优点和缺点。

2)云定价

在每种情况下,企业都需要根据其保存的数据量支付一定的费用。但是,计算的定价是不同的。

例如,Google BigQuery 和 Snowflake 根据扫描的数据量或消耗的计算时间提供按需定价。Amazon Redshift 和 Azure SQL 数据仓库都根据集群中节点的数量或类型对资源收费。

两种定价策略各有利弊。按需模型只对企业使用的内容收费,这样的方式使预算存在问题,因为无法预测用户数量以及他们将执行的查询的数量。

4、总结

云数据仓库是游戏规则的改变者,也是数据仓库的标志性事件。如果使用得当,云数据仓库可能会大大降低企业的运营费用,并使得企业随时掌握业务需求。


云联壹云
124 声望9 粉丝

云联融合云(Yunion Cloud)是一个开源的多云平台。融合云构建在用户分布于多云基础设施之上,通过技术手段将分布于多云的异构IT资源统一管理,将多底层多云的差异向用户屏蔽,并通过网络和调度实现资源的融合与...