【经验分享】使用analyze收集统计信息的正确姿势

2021-06-01
阅读 4 分钟
1.6k
统计数据是描述存储在数据库中的数据的元数据,查询规划器需要最新的统计信息来为查询选择最佳的执行计划。通过执行analyze语句收集和更新统计信息。最近遇到gp5.x通过analyze收集统计信息慢、集群性能下降的现象。本文将分享统计信息收集的优化过程以及涉及到相关概念。

Brin Index在Greenplum 7中的理论与实践 之AO表上的Brin

2021-05-14
阅读 4 分钟
1.3k
在上篇文章中,我们介绍了堆表上的Brin Index,包括Brin的优缺点、适用场景、Brin Scan、Brin Vacuum、Brin Storage等内容。本篇文章将为大家概述Brin在AppendOnly Table上的实现,并结合一些性能测试帮助的大家更好的理解Brin Index。

Brin Index在Greenplum 7中的理论与实践 之 堆表上的Brin

2021-05-13
阅读 5 分钟
2k
2022年初,Greenplum 7版本将正式GA(具体时间和功能请以最终发布为准)。今年,Greenplum中文社区将和墨天轮社区合作,邀请原厂专家,开展《Greenplum 7 新版本大剧透》系列直播。

当谈起Greenplum 7时,我们在谈什么?之内核篇

2021-04-20
阅读 7 分钟
3.6k
在上篇文章中,我们为大家介绍了Greenplum商业版组件的最新近况,下面来具体介绍一下Greenplum 7中内核方面都将带来哪些惊喜。由于7版本中的新特性较多,本文将就一些重点特性进行简单介绍,具体细节可以关注《Greenplum 7新版本大剧透》的后续直播,原厂工程师将为大家详细讲解内核新特性和原理实现。相关PPT可以前往Gr...

当谈起Greenplum 7时,我们在谈什么?之组件篇

2021-04-16
阅读 5 分钟
2.2k
2022年年初,Greenplum 7版本将正式GA(具体时间请以官方信息为准)。今年,Greenplum中文社区将和墨天轮社区合作,邀请原厂专家,开展《Greenplum 7 新版本大剧透》系列直播。

【演讲视频】青梅煮酒,社区资深成员阿福帮你进一步了解Greenplum

2021-03-10
阅读 1 分钟
785
在2021年2月14日情人节,Greenplum中文社区阿福受PG分会邀请,在新年活动中做了关于《Greenplum前世今生》的分享。阿福在本次分享中,为刚接触Greenplum的小伙伴对Greenplum做了一个全面的介绍,作为社区的资深参与者,阿福也希望更多的小伙伴能参与到社区中来,贡献大家的力量。

看! 2020 PG亚洲大会上的Greenplum

2020-11-27
阅读 2 分钟
1.3k
2020年11月17日-20日, PostgresConf.CN & PGconf.Asia2020大会(简称2020 PG亚洲大会)通过线上盛大召开!PostgresConf是面向全球PostgreSQL开发者和使用者的年度盛会。本届大会以“生而全球”为主题,吸引了来自全球的PostgreSQL社区的核心成员及使用PostgreSQL的企业用户、个人用户。大会共凝聚112场次技术报告,共...

Postgresql可串行化快照隔离浅析

2020-11-27
阅读 4 分钟
3.2k
PostgreSQL数据库采用快照隔离(Snapshot Isolation)技术实现并发控制,快照隔离是利用数据的多版本实现并发控制的一种方式。快照保存了某个特定时间点活跃事务的状态信息。在PostgreSQL数据库中,对于Read Committed隔离级别,事务中的每条SQL语句的执行都会获取一个快照,对于Repeatable Read隔离级别,事务只在第一...

Greenplum与PostgreSQL社区双管齐下,谁是PostgreSQL 13 中国的"头号玩家"?

2020-10-30
阅读 2 分钟
1.3k
9月24日,PostgreSQL全球开发组宣布PostgreSQL 13 正式发布!作为世界上最流行的开源数据库之一,PostgreSQL起源于加利福尼亚大学伯克利分校,得益于全球开发者社区超过25年的开源开发,它已成为一款以其可靠性和健壮性著称、优秀的单机开源数据库产品。PostgreSQL的新版本在索引和查找方面进行了重大改进,改进包括索引...

【重磅】Greenplum内核升级至PostgreSQL 12,众多新特性惊喜不断

2020-09-25
阅读 2 分钟
2.5k
​Greenplum 基于 PostgreSQL,但针对大数据的场景和用户对性能的极致追求开发了大量的特性和做了极致甚至苛刻的优化。此外,Greenplum紧密拥抱Postgres社区,以敏捷的方式快速升级Postgres内核。

Greenplum MVCC并发控制:严格的一致性与极致的性能

2020-09-03
阅读 9 分钟
1.6k
2020的夏天已经接近尾声,《深入浅出Greenplum内核》系列直播也已经成功举办了五场活动,内容覆盖了Greenplum架构、执行引擎、查询优化、B树索引(均插入之前的总结文章链接),相关视频可前往B站的Greenplum中文社区频道进行回顾观看。

带你了解可重定位Postgres

2020-08-11
阅读 12 分钟
1.7k
​作为Greenplum Release Engineering团队的工程师,最近有机会深入探讨Postgres的构建系统。Greenplum Server基于Postgres,并从上游继承了构建系统。gp-releng团队正在创建可重定位版本的Greenplum Server,这使我们开始研究如何进行可重定位的Postgres版本。本文提到的可重定位(Relocated)指在不重新编译安装Postgre...

带你认识PostgreSQL检索神器——Brin Index

2020-07-24
阅读 4 分钟
3.4k
Greenplum是一款强大而稳定的企业级分布式数据库。虽然基于 PostgreSQL,但Greenplum针对大数据的场景和用户对性能的极致追求开发了大量的特性和做了极致甚至苛刻的优化。此外,Greenplum紧密拥抱Postgres社区,以敏捷的方式快速升级Postgres内核。在Postgres 9.5的内核中,Postgres引入了一种全新的索引类型,名为Brin ...

新鲜出炉的PGCon2020演讲回顾 ①——全局死锁检测器

2020-06-11
阅读 6 分钟
1.6k
​5月26日,一年一度的PG开发者大会PGCon2020如约而至。与往年不同的是,受疫情的影响,今年的PGCon采取了线上会议的方式,虽然没有了面对面的交流,但在组织者Dan Langille等的精心安排下,会议有了更广泛的受众,干货满满。来自Greenplum原厂的Greenplum内核工程师 Hubert Zhang(张桓)与Asim Praveen合作发表了演讲《...

「揭秘GP」VLDB 创始人:为什么和其他相比,Greenplum 是最好的

2020-06-02
阅读 6 分钟
2.3k
导读:从最初的 Greenplum 开始,到现在已经超过15年的验证,我们一直是 Greenplum 的用户。多年来,随着我们对产品和支持的信心不断增强,它已逐渐成为VLDB的默认平台。希望本文讲述的这些原因能解除大家的困惑。

Greenplum 带ORCA 优化器的编译安装解析

2020-03-26
阅读 4 分钟
2k
ORCA是开源的Postgres和Greenplum的优化器,相比于Greenplum和Postgres内置的优化器,ORCA在复杂查询以及分区表等场合有非常好的性能提升。这里介绍下如何使Greenplum启用ORCA优化器,以及如何运行Greenplum的测试用例installcheck-world。

全面解读PostgreSQL和Greenplum的Hash Join

2020-03-16
阅读 9 分钟
6.4k
2019年10月15日,Pivotal中国研发中心副总经理兼Greenplum中文社区发起人姚延栋出席了于意大利举行的PostgreSQL Conference Europe并发表了精彩的演讲《How does Hash Join work in PostgreSQL and its derivates》。本文根据演讲内容整理而成,供大家学习交流。

【Greenplum避坑指南 II 】Greenplum 环境搭建和基本查错

2020-03-13
阅读 5 分钟
3k
在Greenplum避坑指南系列的上一篇《“我的SQL跑了很长时间没有结果怎么办?》中,我们介绍了解决SQL卡住和运行时间长的原因和解决方案。今天,我们将为大家讲一讲Greenplum用户在刚开始接触GP时经常会问的一个问题“Greenplum如何搭建?”以及一些避免掉坑的注意事项。

Greenplum数据分布和分区策略

2020-03-13
阅读 3 分钟
2.3k
​Greenplum是一个大规模并行处理数据库,它由一个master和多个segment组成,其数据按照设定的分布策略分布于各个segment上。数据表的单个行会被分配到一个或多个segment上,但是有这么多的segment,它到底会被分到哪个或哪些segment上呢?分布策略会告诉我们。

TPC-B测试:Greenplum 6版本比5版本到底好了多少?

2020-03-08
阅读 7 分钟
3.8k
pgbench是一种在PostgreSQL上运行基准测试的简单程序。它可能在并发的数据库会话中一遍一遍地运行相同序列的 SQL 命令,并且计算平均事务率(每秒的事务数)。默认情况下,pgbench会测试一种基于 TPC-B 但是要更宽松的场景,其中在每个事务中涉及五个SELECT、UPDATE以及INSERT命令。但是,通过编写自己的事务脚本文件很...

Solr Cache最佳实践帮你轻松调优

2020-03-08
阅读 3 分钟
2.5k
Apache Solr是被广泛使用的开源搜索引擎,Greenplum DB的全文检索组件Greenplum Text就是基于其构建的:Greenplum Text简写为GPText,它将Greenplum数据库与Apache SolrCloud企业搜索和MADlib分析库进行紧密集成,从而为客户提供了大规模分析处理和业务决策支持,主要功能包括免费的文本搜索以及对文本分析的支持。

【Greenplum常见问题】 “我的SQL卡住了怎么办?”

2020-03-08
阅读 5 分钟
2.9k
​大家好,我是Pivotal Greenplum团队的一名售后工程师。平时会帮助我们的全球的商业用户解决数据库的相关的问题。在实际工作中,我们经常会被数据库管理员问及:“我的SQL跑了很长时间没有结果,我该怎么样排查?” “数据库某一条SQL卡住了怎么办?” 今天,我们将就这个内容做一些分析和总结。

Greenplum——新一代 PB 级分布式 HTAP 数据库

2020-03-07
阅读 9 分钟
5.2k
2019年Pivotal中国研发中心副总兼Greenplum中文社区发起人姚延栋受阿里云开发者社区邀请于钉钉进行技术直播演讲《基于PostgreSQL的PB级开源企业级分布式HTAP数据库》。本文由演讲内容整理而成。