正式开源:从 Greenplum 到 Cloudberry 迁移工具 cbcopy 发布

10 月 31 日
阅读 3 分钟
218
Hi 社区小伙伴们!酷克数据 HashData 正式宣布:大家期待已久的从 Greenplum 到 Cloudberry 数据迁移工具 cbcopy 正式开源啦!GitHub 仓库:[链接]

CloudberryDB内核分享:增量物化视图的原理与实现讲解

10 月 17 日
阅读 6 分钟
187
增量物化视图的核心在于"增量",仅处理自上次更新以来的数据变动,避免重新计算整个视图,显著降低计算和时间开销。通过捕获并计算增量数据,它能高效维护最新数据结果,在实时数据分析、报表生成和数据同步等场景中,成为提升查询性能、减少存储开销的不可或缺工具。视图和物化视图视图(View)

第三位中国成员!CloudberryDB 核心开发者张明礼入选 PostgreSQL Contributor 名单

10 月 10 日
阅读 2 分钟
219
近日,PostgreSQL 国际社区揭晓了新一批 Contributor 名单,授予那些对 Postgres 有着长期的,数量可观贡献的开发者,由 Postgres Core Team 不定期评估产生。其中,来自酷克数据(HashData)的资深数据库内核研发工程师 Zhang Mingli 老师荣获 PostgreSQL 国际社区官方认可的 Contributor 称号,这也是第三位获此殊荣的...

CloudberryDB 内核分享:Directory Table 底层逻辑与实现原理讲解

9 月 12 日
阅读 5 分钟
189
在之前的直播中,我们向大家介绍了Directory Table如何统一纳管非结构化数据,为企业AI应用创新提供更高质量的非结构化数据语料输入和知识库支持。随着我们的开源数据仓库产品Cloudberry Database(简称“CloudberryDB”)日渐完善,Directory Table现在已经正式开源。在之前的直播中我们为大家详细讲解了Directory Table ...

DTCC2024|HashData Enterprise 4.0 正式发布:构建云原生统一数据处理平台

8 月 28 日
阅读 1 分钟
269
2024 年 8 月 22 日 -24 日,由 IT168 联合旗下 ITPUB、ChinaUnix 两大技术社区主办的第 15 届中国数据库技术大会(DTCC2024)在北京隆重召开。酷克数据(HashData)研发副总裁杨瑜受邀出席数据库内核+技术创新专场,并正式为发布了 HashData Enterprise 4.0 新版本。
封面图

活动回顾|首次 Cloudberry Database Meetup · 北京站成功举办

8 月 8 日
阅读 4 分钟
253
8 月 3 日,由酷克数据 HashData 主办的 Cloudberry Database Meetup 北京站活动圆满结束。本次 Meetup 以“以开源应对 Greenplum 闭源,原厂开发者再聚首”为主题,深入探讨了 Greenplum 闭源所带来的影响,并聚焦于 Cloudberry Database,邀请核心贡献者与大家分享了 Cloudberry Database 的开源孵化历程、发展路线图以...

酷克数据出席 2024 可信数据库发展大会 存算分离架构驱动电信行业数据平台革新

7 月 18 日
阅读 3 分钟
297
7 月 16 日 - 17 日,由中国通信标准化协会和中国信息通信研究院主办,大数据技术标准推进委员会承办,InfoQ 联合主办的「2024 可信数据库发展大会」(TDBC)在北京召开。酷克数据解决方案架构师吴昊受邀参与“电信行业数据库应用创新分论坛”,并发表《存算分离架构:加速电信行业数据处理,驱动业务创新》主题演讲,深入...
封面图

开源创新引领未来|酷克数据亮相PostgreSQL中国技术大会,荣获数据库杰出贡献奖

7 月 13 日
阅读 7 分钟
260
7 月 12 日,第 13 届 PostgreSQL 中国技术大会在杭州盛大开幕。本次大会以“聚焦云端创新,汇聚智慧共享”为主题,邀请了国内外 PG 领域众多行业大咖、学术精英及技术专家,共同探讨数据库领域的发展趋势、技术创新和实践经验。酷克数据作为国内领先的 PG 技术栈实践者和重要的社区贡献者出席本次大会,酷克数据的技术专...

PostgreSQL 技术内幕(十七):FDW 实现原理与源码解析

6 月 24 日
阅读 6 分钟
844
对于一定规模的系统而言,数据仓库往往需要访问外部数据来完成分析和计算。外部数据包装器(Foreign Data Wrapper, 简称 FDW)是 PostgreSQL 提供的访问外部数据源机制。用户可以使用简单的 SQL 语句访问和操作外部数据源,就像操作本地表一样。在上次直播中,我们深入探讨了 PostgreSQL FDW 的基本概念、详细使用方法...

PostgreSQL 17 Beta1 发布,酷克数据再次贡献核心力量

6 月 5 日
阅读 4 分钟
904
得益于全球的开发者贡献,PostgreSQL已成长为一款拥有众多全球用户和贡献者、成熟稳定的开源数据库。2024年5月23日,PostgreSQL全球开发组宣布,PostgreSQL 17的首个 Beta 版本现已开放下载。本次新版本带来了众多惊喜。值得一提的是,本次发布中,酷克数据HashData研发团队参与了多出核心代码贡献,为PostgreSQL项目与...

如何优雅实现存算分离:缓存及Tablespace讲解与演示

5 月 30 日
阅读 3 分钟
809
在传统的紧耦合系统设计中,存储与计算密不可分,但随着业务的发展,常常会为了扩存储而带来额外的计算扩容,这其实就是一种浪费;同理,只为了提升计算能力,也会带来一段时期的存储浪费。存算分离的架构已然成为行业发展的客观需要。在设计大型系统时,我们必须深入思考底层存储该如何设计。如果单纯依赖扩容存储来应...

PostgreSQL技术内幕(十六)如何写一个执行器算子?

5 月 24 日
阅读 7 分钟
794
执行器是数据库最重要的模块之一,作为连接查询计划和存储引擎的桥梁,负责从存储引擎读取数据,并基于查询计划树执行对应的算子,得到最终的查询结果。在PostgreSQL技术内幕系列(十六)的直播中,光城老师为大家介绍了PG执行器基本原理和实现机制,并演示了如何从0到1写一个执行器算子。下文根据直播文字整理而成。

优化企业数据策略,云原生数据仓库助力全域数据融合与要素化

5 月 17 日
阅读 6 分钟
310
在数据要素化与大模型私域部署落地的时代背景下,企业的数据运营战略正经历着前所未有的变革与升级。随着大量的异源异构数据不断积累,如何高效、精准地管理和运营企业的海量数据,成为了一大挑战。本次直播中,我们介绍了企业数据战略的新架构,以及云原生数据仓库如何打通数据运营的各种底层诉求,实现全域数据的无缝...
封面图

携手鲲鹏昇腾 HashData展现云原生数仓创新力量

5 月 10 日
阅读 1 分钟
181
5月9日-11日,鲲鹏昇腾开发者大会2024在北京中关村国际创新中心举行,众多行业领袖、专家学者及优秀开发们齐聚一堂,分享产业趋势、技术创新和应用实践。

酷克数据启动鲲鹏原生应用开发合作

4 月 29 日
阅读 2 分钟
270
4月28日,北京酷克数据科技有限公司(以下简称“酷克数据”)与华为举办鲲鹏原生应用开发启动仪式。酷克数据将基于鲲鹏硬件底座、OpenEuler、开发套件Kunpeng DevKit、应用使能套件Kunpeng BoostKit开展面向金融、政务、电信、能源、交通等重点行业的原生应用开发,打造基于鲲鹏架构的云数仓产品解决方案,并持续发布性能...

数据统一高效管理 HashData支撑“数智石油”高质量发展

4 月 26 日
阅读 2 分钟
213
酷克数据(HashData)作为赋能石油石化企业数字化转型的先进代表,受邀参加此次行业盛会,展示了与昆仑数智携手打造的油气行业数据湖联合解决方案和创新成果。在会上,酷克数据资深解决方案架构师李俊介绍了HashData技术团队对湖仓技术的思考与创新,分享酷克数据在油气行业的最佳应用实践。

HashData获得华为鲲鹏Validated认证 信创版图持续壮大

4 月 23 日
阅读 1 分钟
267
在本次Validated认证过程中,酷克数据携手北京鲲鹏联合创新中心,针对数据仓库的典型应用场景,基于OpenEuler操作系统、鲲鹏920处理器和Taishan 200服务器完成了全栈调优测试。在TPC-DS测试中,HashData云数仓表现卓越,实现性能大幅提升。

HashData的湖仓一体思考:非结构化数据支持(Directory Table等)讲解及演示

3 月 26 日
阅读 6 分钟
257
随着LLM基座的不断成熟和生态的不断完善,越来越多的企业开始在自身业务场景的应用探索,以实现降本增效。然而,在这一过程中,企业不得不面对两种AI应用形态的选择:

PostgreSQL技术内幕(十四)探索PG的进程与内存管理

3 月 15 日
阅读 4 分钟
1.1k
PostgreSQL因为性能卓越、运行稳定的特点而广受欢迎,高效和精细的进程与内存管理机制是性能和稳定背后重要的支撑。它采用多进程协同配合架构,进程间通过共享内存进行通信。

酷克数据荣获粤港澳大湾区金融创新成果“特优解决方案”奖

3 月 8 日
阅读 1 分钟
224
近日,“第二届金融创新优秀应用案例与解决方案技术成果评定”正式揭晓,酷克数据提交的“HashData云原生金融信创数据仓库”入选特优解决方案,成为数据治理与数据平台类目中唯一的厂商方案。

HashData的湖仓一体思考:Iceberg、Hudi特性讲解与支持方案

3 月 5 日
阅读 5 分钟
748
湖仓一体作为一种新兴的开放式数据管理架构,能够充分发挥数据湖的灵活性、生态丰富以及数据仓库的企业级数据分析能力,已经成为企业建设现代数据平台的热门选择。

PostgreSQL技术内幕(十三)探究MPP数据库分布式查询分发Dispatcher

2 月 20 日
阅读 6 分钟
466
Dispatcher(分布式查询分发器)是MPP数据库的核心组件,所有的查询任务都要经过其进行分发,起着沟通用户到协调者(Coordinator,即QD)和执行调度的关键作用。

数据访问效率百倍提升 HashData助力中国石油乘“数”而行

1 月 29 日
阅读 2 分钟
346
新年伊始,一封由中国石油天然气集团公司(以下简称:中国石油)下属某大型油田发来的感谢信,从千里之外,寄送到HashData工程服务团队。在信中,客户对HashData在该公司数智化转型中的出色表现给予高度肯定,对项目技术专家团队卓有成效的工作、优秀专业的能力和认真负责的精神表示肯定与表彰!

点赞!HashData连续三年获评数据猿“最具投资价值企业奖”

1 月 25 日
阅读 2 分钟
311
近日,由上海市经济和信息化委员会、上海市科学技术委员会指导,数据猿和上海大数据联盟共同主办的“第六届金猿季&魔方论坛——大数据产业发展论坛”在上海举行。本次活动以“小趋势·大未来”为主题,展示了大数据与人工智能、云计算、5G等新技术结合下的落地应用与发展潜力,以此激发企业的数据资产价值,推动数据技术能力升级。

HashData湖仓一体方案:方案概览与Hive数据同步

1 月 16 日
阅读 2 分钟
552
随着云计算、大数据、AI的发展和普及,各行各业的业务场景日益复杂,数据呈现出大规模、多样性的特点,企业对数据仓库的需求也进一步拓展至对多元化数据实时处理的场景。

Postgres 中文周报:PostgreSQL 2023 热门回顾

1 月 8 日
阅读 3 分钟
361
2024 新年好!原英文 Postgres Weekly 最新一期回顾了 2023 周刊中的热门点击文章、视频与工具等事项。当然,PostgreSQL 在 2023 年值得回顾的瞬间还有很多,远不止周刊中提到的。因此,在编译原周刊内容的基础上,我们增加了几个维度作为补充,如奖项、会议、版本发布等,为大家回顾 PostgreSQL 2023 年提供更多素材。

BDTC2023:CloudberryDB开源创新与实践

2023-12-28
阅读 3 分钟
625
中国大数据技术大会(BDTC)由中国计算机学会(CCF)创立于2008年,已经成为国内外极具行业实践的专业大数据交流平台。12月22日-24日,第十七届中国大数据技术大会(BDTC 2023)在广州举行。酷克数据(HashData)研发副总裁杨瑜受邀在“开源数据库”分论坛发表主题演讲,从产业实践和技术发展趋势的角度,介绍了HashData开...

喜报!酷克数据携手中移在线入选2023大数据“星河”数据库优秀案例

2023-12-25
阅读 4 分钟
323
12月20日-21日,由中国信通院、中国通信标准化协会主办,中国通信标准化协会大数据技术标准推进委员会承办的“2023数据资产管理大会”在京召开。

全面解读《State of PostgreSQL 2023》报告

2023-12-22
阅读 7 分钟
341
本文由 Cloudberry Database 社区根据 Timescale 发布的 2023 年最新《State of PostgreSQL》英文版报告整理而成。

创新铸就卓越 HashData再度荣获 IT168技术卓越奖

2023-12-21
阅读 2 分钟
165
12月20日,由国内专业数据库及架构技术社区 ITPUB、 IT 垂直门户IT168 联合主办的“2023 技术卓越奖”评选结果正式揭晓, 酷克数据基于云原生架构打造的HashData云数仓,凭借创新的技术架构、强大的性能表现、行业领先的落地规模,连年斩获数据库行业“技术卓越奖”。