【亚洲峰会】Greenplum高级功能和案例,带你回顾六大话题

2021-01-07
阅读 3 分钟
1.9k
Greenplum 中国技术峰会是决策者、数据科学家、分析师、DBA 和开发人员聚会的地方,在这里一起共同讨论,共享和塑造高端数据技术的未来。今年由于疫情原因,我们将峰会搬到了线上。继全球峰会成功举办后,我们又相继举办了多场线上亚太峰会,分别以中文、英语和韩语为大家呈现多个精彩内容。

适用于开源&商业版的Greenplum监控解决方案

2020-12-18
阅读 9 分钟
1.6k
Greenplum是全球首个开源MPP数据库,内核基于PostgreSQL。目前迭代迅速,内核已经由PostgreSQL 8.2升级到了9.x。随着这款数据库在国际国内的大规模推广,企业级用户越来越多的将Greenplum选用为大数据分析平台。作为一款企业级数据库,监控是必不可少的一环。商业版本的Greenplum提供商业组件GPCC,用来对Greenplum进行...

精彩内容最全总结,Greenplum亚太峰会第一场(内含视频)

2020-12-15
阅读 3 分钟
1.5k
​Greenplum 中国技术峰会是决策者、数据科学家、分析师、DBA 和开发人员聚会的地方,在这里一起共同讨论,共享和塑造高端数据技术的未来。今年由于疫情原因,我们将峰会搬到了线上。

入门机器学习必备课:一站搞定概念+算法+实践

2020-12-03
阅读 2 分钟
1.1k
人工智能是计算机科学的一个分支,它的主要研究目标是用计算机程序来表示人类智能。这个词最早是在1956年的达特茅斯会议上正式提出的。在达特茅斯会议正式提出“人工智能”这个概念之前,图灵和早期的计算机科学家一般用“机器智能”这个词。如今人工智能的浪潮正席卷全球,诸多相关热点词汇时常萦绕在耳边:AI,机器学习,...

万字长文,帮你梳理存储引擎之Heap表关键知识点

2020-12-03
阅读 9 分钟
1.1k
《深入浅出Greenplum内核》系列直播已经进行到第八场,还有二场就要告一段落啦!前八场的视频内容可以前往Greenplum中文社区B站频道观看相关视频,相关PPT均已上传Greenplum中文社区网站(cn.greenplum.org)的下载页面,欢迎获取!现在让我们通过这篇万字长文来回顾一下第七场活动《Greenplum分布式事务》精华内容。

看! 2020 PG亚洲大会上的Greenplum

2020-11-27
阅读 2 分钟
1.3k
2020年11月17日-20日, PostgresConf.CN & PGconf.Asia2020大会(简称2020 PG亚洲大会)通过线上盛大召开!PostgresConf是面向全球PostgreSQL开发者和使用者的年度盛会。本届大会以“生而全球”为主题,吸引了来自全球的PostgreSQL社区的核心成员及使用PostgreSQL的企业用户、个人用户。大会共凝聚112场次技术报告,共...

Postgresql可串行化快照隔离浅析

2020-11-27
阅读 4 分钟
3.2k
PostgreSQL数据库采用快照隔离(Snapshot Isolation)技术实现并发控制,快照隔离是利用数据的多版本实现并发控制的一种方式。快照保存了某个特定时间点活跃事务的状态信息。在PostgreSQL数据库中,对于Read Committed隔离级别,事务中的每条SQL语句的执行都会获取一个快照,对于Repeatable Read隔离级别,事务只在第一...

Greenplum一体机硬件配置正式开源

2020-11-27
阅读 2 分钟
867
2015年,Greenplum数据库宣布开源。如今,DELL将Greenplum数据库一体机的硬件配置也开放给了Greenplum社区。Greenplum成为了全球首个MPP数据仓库的软件和硬件同时开源的平台。我们坚信开放是未来的趋势。

终于把分布式事务讲明白了!

2020-11-26
阅读 11 分钟
3k
《深入浅出Greenplum内核》系列直播已经进行到第七场。错过活动的小伙伴可以前往Greenplum中文社区B站频道观看相关视频,相关PPT均已上传Greenplum中文社区网站(cn.greenplum.org)的下载页面,欢迎获取!现在让我们通过这篇万字长文来回顾一下第七场活动《Greenplum分布式事务》精华内容。

大规模金融交易数据分析的高性能解决方案:Greenplum + GPText

2020-11-04
阅读 1 分钟
1k
在商业世界中,大多数非结构化数据都位于与客户相关的文本中。可惜,大多数公司都不知道如何从非结构化的客户数据中有效地提取有用的信息来帮助预测和分析。但是,如果做对了,从大量文本中提取有价值的预测见解仅需几秒钟。”

听说它是层级数据的处理“神器”!

2020-11-03
阅读 4 分钟
1.5k
​递归CTE是Greenplum中一个非常强大的功能,它使得Greenplum具有了处理层级数据和图数据的能力。那么,什么是递归CTE呢?递归CTE的名字中虽然包含CTE,但它们的功能,用法和实现都有很大的不同。

Greenplum开源升级工具gpupgrade beta版,欢迎试用!

2020-10-30
阅读 2 分钟
892
自2019年起,Greenplum数据库团队就开始致力于构建Greenplum原地升级工具gpupgrade。gpupgrade致力于提供一个简便的升级途径帮助用户在升级的过程中减少时间和空间的消耗。该工具将使客户能够方便放心的快速升级到Greenplum数据库的最新版本,让Greenplum在快速迭代的同时更快的获得客户反馈。

万字长文,助你掌握数据库排序算法

2020-10-30
阅读 10 分钟
1.1k
在《深入浅出Greenplum内核》系列直播的第六场中,Greenplum内核研发张桓为大家详细介绍了Greenplum排序算法,相关视频已上传Greenplum中文社区B站频道。相关PPT请点击链接前往Greenplum中文社区网站(cn.greenplum.org)的下载页面获取。现在让我们通过这篇“万字长文”回顾一下活动精华吧!

Greenplum与PostgreSQL社区双管齐下,谁是PostgreSQL 13 中国的"头号玩家"?

2020-10-30
阅读 2 分钟
1.3k
9月24日,PostgreSQL全球开发组宣布PostgreSQL 13 正式发布!作为世界上最流行的开源数据库之一,PostgreSQL起源于加利福尼亚大学伯克利分校,得益于全球开发者社区超过25年的开源开发,它已成为一款以其可靠性和健壮性著称、优秀的单机开源数据库产品。PostgreSQL的新版本在索引和查找方面进行了重大改进,改进包括索引...

Solr 7 的响应速度竟然可以提高10倍!?

2020-10-14
阅读 10 分钟
1.8k
​Apache Solr是一款基于Apache Lucene的高效文本检索引擎,它具有容错性(fault tolerant),高可用(highly availability),易扩展(scalability),分布式(distribution)等特点,在世界上著名的大型应用和网站中被广泛使用,如eBay, Instagram, Netflix等。

巧用复合索引,优化查询性能

2020-09-25
阅读 6 分钟
1.3k
​复合索引,也称作多字段索引,是指建立在表的多个字段上的索引,它是数据库系统中广泛支持的索引使用方式,Greenplum也不例外。在之前的文章中,我们已经介绍了Greenplum的默认索引——B树索引。本文将对Greenplum中的复合索引以及相关的最佳实践进行简要介绍。《深入浅出Greenplum内核》系列直播正在进行中,本周五Green...

【重磅】Greenplum内核升级至PostgreSQL 12,众多新特性惊喜不断

2020-09-25
阅读 2 分钟
2.5k
​Greenplum 基于 PostgreSQL,但针对大数据的场景和用户对性能的极致追求开发了大量的特性和做了极致甚至苛刻的优化。此外,Greenplum紧密拥抱Postgres社区,以敏捷的方式快速升级Postgres内核。

一条命令快速启动Greenplum

2020-09-22
阅读 1 分钟
1.2k
作为全球首个开源、多云大数据平台,Greenplum致力于OLAP系统数据引擎开发,2019年发布的6版本让其具备了对OLTP和混合负载很好的支持能力。更多关于Greenplum的内容,欢迎访问Greenplum中文社区网站cn.greenplum.org。

手把手教你在 ARM 架构服务器上编译 Greenplum6并制作rpm安装包

2020-09-22
阅读 4 分钟
2k
Greenplum 是一款开源MPP数据分析平台,提供包括数据分析、机器学习和人工智能等特色功能。目前 Greenplum 的二进制发行版本只能运行在 X86 服务器。github上的Greenplum releases只有x86的发行版,没有提供ARM 发行版。Greenplum 是开源软件,我们可以通过编译 Greenplum 源代码自行构建 Greenplum 的 ARM 版本。

Greenplum MVCC并发控制:严格的一致性与极致的性能

2020-09-03
阅读 9 分钟
1.6k
2020的夏天已经接近尾声,《深入浅出Greenplum内核》系列直播也已经成功举办了五场活动,内容覆盖了Greenplum架构、执行引擎、查询优化、B树索引(均插入之前的总结文章链接),相关视频可前往B站的Greenplum中文社区频道进行回顾观看。

建行数据从Teradata迁移到Greenplum大揭秘

2020-09-03
阅读 6 分钟
2.7k
​绿树阴浓夏日长 ,楼台倒影入池塘。又是一年盛夏了,忽然想起了三年前的盛夏,和一帮建行的兄弟们在机房挥汗如雨,加班加点搞“迁移长征”的场景。

带你了解Greenplum的锁管理机制

2020-08-28
阅读 4 分钟
1k
数据库系统有多种实现并发控制的机制,而锁作为其中一种实现方式,具有非常重要的作用。在这篇文章中,我们将介绍Greenplum中的锁管理机制是如何实现的。本周五(8月28日)的《深入浅出Greenplum内核》第六场活动中,来自Greenplum原厂的内核研发将深度揭秘MVCC并发控制的其他内容,尽请关注。

【青梅快讯】快速迭代,最新版本Greenplum 6.10已发布

2020-08-28
阅读 3 分钟
1.5k
​自Greenplum 6.0正式发布以来,Greenplum保持了每月一个小版本的快速迭代速度,持续为用户提供新功能与修复补丁。最新版本6.10已于8月10日发布。现在小编带你回顾一下6.8到6.10版本中,Greenplum都带来了哪些惊喜。

穿上新衣,手提干货,Greenplum中文社区网站回来啦!

2020-08-28
阅读 2 分钟
794
了解更多Greenplum技术干货,欢迎访问Greenplum中文社区网站在休息一段时间后,Greenplum中文社区网站整装待发啦!穿上新衣,手提干货,以前有的一点都不会少,我们为你准备了更多!快来 [链接] 看看吧!全新的界面设计Greenplum logo色的界面设计,在这炎炎夏日☀️ 为你带来一丝凉爽与清新。丰富的社区资料技术博文、开...

Greenplum SQL问题重现利器 Minirepo

2020-08-19
阅读 3 分钟
1.2k
大家在使用Greenplum的过程中可能会遇到跑了某种SQL而导致数据库PANIC问题,或者数据库的执行计划并没有那么合理而导致SQL性能过慢的问题。

带你了解可重定位Postgres

2020-08-11
阅读 12 分钟
1.7k
​作为Greenplum Release Engineering团队的工程师,最近有机会深入探讨Postgres的构建系统。Greenplum Server基于Postgres,并从上游继承了构建系统。gp-releng团队正在创建可重定位版本的Greenplum Server,这使我们开始研究如何进行可重定位的Postgres版本。本文提到的可重定位(Relocated)指在不重新编译安装Postgre...

要懂Greenplum索引,心里得有B树!

2020-07-31
阅读 10 分钟
1.5k
7月24日,Greenplum原厂内核研发马洪旭和大家直播分享了《深入浅出Greenplum内核》系列直播的第四期《Greenplum内核揭秘之B树索引》。相关视频已上传至Greenplum中文社区B站频道,戳这里即可观看。本文概括了文章的精华内容,欢迎大家给我们留言交流。

带你认识PostgreSQL检索神器——Brin Index

2020-07-24
阅读 4 分钟
3.4k
Greenplum是一款强大而稳定的企业级分布式数据库。虽然基于 PostgreSQL,但Greenplum针对大数据的场景和用户对性能的极致追求开发了大量的特性和做了极致甚至苛刻的优化。此外,Greenplum紧密拥抱Postgres社区,以敏捷的方式快速升级Postgres内核。在Postgres 9.5的内核中,Postgres引入了一种全新的索引类型,名为Brin ...

Greenplum-Spark Connector 介绍

2020-07-17
阅读 7 分钟
2.9k
Greenplum 是一款优秀的 mpp 数据库产品,官方推荐了几种将外部数据写入 Greenplum 方式,包含:通用的 Jdbc,gpload 以及 Pivotal Greenplum-Spark Connector 等。

基于Greenplum+Kafka的实时数据处理

2020-07-17
阅读 1 分钟
2.1k
在追求数据时效性的今天,如何高效处理低延时的流数据,逐渐成为大家越来越关注的问题。流数据处理能力已成为衡量大数据平台计算实力的一个重要指标。Greenplum研发团队在开源Greenplum的基础上,提供了新的高速流数据引擎GPKafka,从而将Greenplum强大的SQL处理能力引入到流计算领域。