总结一些ES不常用的filter

2020-09-29
阅读 8 分钟
3k
ES内置的token filter很多,大部分实际工作中都用不到。这段时间准备ES认证工程师的考试,备考的时候需要熟悉这些不常用的filter。ES官方对一些filter只是一笔带过,我就想着把备考的笔记整理成博客备忘,也希望能帮助到有这方面需求的人。

ES对磁盘的要求都有哪些,大部分你可能不知道

2020-09-14
阅读 2 分钟
2.7k
有一个问题被关注的比较少,就是ES对本地磁盘的占用情况。有人可能觉得这个问题的答案显而易见,不就是ES软件本身占用的空间,还有索引数据持久化占用的磁盘空间,另外就是一些日志了。

ES数组类型字段搜索以及数组空值搜索

2020-09-10
阅读 1 分钟
15k
es存储的某一个字段值为数组,现搜索的时候需要搜索出结果该字段值为空或包含某几个值的数据,该怎么写例如: "job_type" : ["12","49","67"] 或者 "job_type" : [ ]需要搜出job_type中包含49的或者为空的数据

ES系列之原理copy_to用好了这么香

2020-09-09
阅读 3 分钟
2.6k
Elasticsearch(以下简称ES)有个copy_to的功能,之前在一个项目中用到,感觉像是发现了一个神器。这个东西并不是像有些人说的是个语法糖。它用好了不但能提高检索的效率,还可以简化查询语句。

讲得最明白的Elasticsearch源码调试环境搭建教程

2020-08-16
阅读 7 分钟
6.1k
使用elasticsearch(以下简称ES)也有挺长时间了,一直想找机会深入源码研究下。我看源码有个习惯,就是一定要运行起来。不是只把源码下载下来看看就行的。

spring data操作ES简直不能再香

2020-06-27
阅读 8 分钟
9.2k
Elasticsearch(以下简称ES)并不像mysql这么容易上手,很多java程序员会觉得ES的java客户端比较难以掌握,尽管ES 7.x官方推荐的high level client已经相对于早期的TransportClient好用很多了。

给你总结几个ES下最容易踩的坑

2020-05-30
阅读 3 分钟
8.5k
我本人接触Elasticsearch(一下简称ES)有挺长一段时间了,本文结合自己的一些项目经验,给你总结几个实际项目中比较容易踩到的坑。希望读者能够避免犯这样的错误。

ES系列之利用filter让你的查询效率飞起来

2020-05-11
阅读 3 分钟
18.6k
Elasticsearch(下面简称ES)中的bool查询在业务中使用也是比较多的。在一些非实时的分页查询,导出的场景,我们经常使用bool查询组合各种查询条件。

ES主分片和副本数据大小不一样的情况

2020-05-05
阅读 2 分钟
4k
引言 很多认为Elasticsearch(以下简称ES),同一个分片的主分片和副本分片文档数量肯定是样的,数据大小也是一样的。 这个其实值说对了一半,文档数量是一阳台的没错,但是数据大小不一定一样。 产生这种现象的原因在于,主分片和副本分片的segment数量可能不一样。 正文 我们来看个示例。 以下的示例测试环境是ES 7.1.0...

关于kibana的可视化可能都在这篇文章里了

2020-05-02
阅读 3 分钟
5.6k
kibana是elasticsearch(以下简称ES)的可视化平台,笔者平时使用kibana的dev tools比较多,在这里可以更便捷的使用ES的各种命令,DSL查询语句等。

ES系列之原来查看文档数量有这么多姿势

2020-04-03
阅读 3 分钟
14.5k
1、引言 有人可能觉得,查看文档数量不是很简单吗?直接 {代码...} 不就可以了吗。 事实上远不止这么简单,比如嵌套文档的情况等。相信你看了我这篇文章之后你会感叹原来统计文档有这么多讲究啊。 2、正文 cat/count 首先是最常用的的方式,也是一种快速查询文档的优先推荐方式,cat count api我们使用kibana自带的电商...

ES系列之嵌套文档和父子文档

2020-03-26
阅读 10 分钟
9.8k
ElasticsSearch(以下简称ES)处理这种关系虽然不是特别擅长(相对于关系型数据库),因为ES和大多数 NoSQL 数据库类似,是扁平化的存储结构。索引是独立文档的集合体。不同的索引之间一般是没有关系的。

ES系列之一文带你避开日期类型存在的坑

2020-03-19
阅读 4 分钟
21.1k
时间相关的字段是ElasticsSearch(以下简称ES)最常用的字段了,几乎所有的索引应用场景都会有时间字段,一般用于基于时间范围的搜索,聚合等场景。但是由于时区的问题,相信很多小伙伴都踩到过时间字段的坑,笔者自己就踩过。

ES系列之原来ES的聚合统计不准确啊

2020-03-15
阅读 4 分钟
8.2k
本篇文章不是讲ElasticSearch(下面简称ES)聚合分析的基本概念和用法的,这些网上的资料很多,不清楚的可以自行查阅。 我下面聚合分析使用的数据都是kibana自带的,这样方便有些读者实际测试文中的示例。 基本概念 ES为了满足搜索的实时性,在聚合分析的一些场景会通过损失精准度的方式加快结果的返回。这其实ES在实时...

一文带你彻底弄懂ES中的doc_values和fielddata

2020-02-01
阅读 4 分钟
9.2k
这两个概念源于Elasticsearch(后面简称ES)除了强大的搜索功能外,还可以支持排序,聚合之类的操作。搜索需要用到倒排索引,而排序和聚合则需要使用 "正排索引"。说白了就是一句话,倒排索引的优势在于查找包含某个项的文档,而反过来确定哪些项在单个文档里并不高效。

Elasticsearch java API客户端介绍

2020-01-02
阅读 4 分钟
4.8k
基本上官方指南就已经向我们说明了一切。如下图所示: 从官方指南上,ES的java 客户端分为两个大类。分别是: Java REST Client Java API 下面分别说下这两种有什么区别。 Java API 在ES 7.0之前最常采用的API,基于TransportClient客户端。网上大部分ES 客户端的资料基本都是基于它的。这种方式在ES 7.x后已经不被官方...

使用kafka连接器迁移mysql数据到ElasticSearch

2020-01-01
阅读 5 分钟
3.6k
把 mysql 的数据迁移到 es 有很多方式,比如直接用 es 官方推荐的 logstash 工具,或者监听 mysql 的 binlog 进行同步,可以结合一些开源的工具比如阿里的 canal。