Spark读取ElasticSearch数据优化

2020-08-21
阅读 3 分钟
6.6k
一般业务上,我们只会关心写ElasticSearch,写也没有用到spark-elasticsearch组件。使用的是ElasticSearch原生的bulkProcessor。

ElasticSearch ILM试玩

2020-08-17
阅读 3 分钟
1.9k
ElasticSearch ILM试玩创建一个生命周期管理策略官方给的例子 {代码...} 自己随便造一个,完全可以在Kibana界面上完成操作~ {代码...} 创建一个带有策略的索引副本官方示例 {代码...} 自己造一个 {代码...} 写入索引文档测试 {代码...} 测试的一些问题疑惑设置的是1个文档就rollover,连续放入了好几个文档,也不会生成...

ElasticSearch 聚合操作

2019-12-20
阅读 5 分钟
1.4k
ElasticSearch 聚合操作 准备数据 {代码...} Metric聚合 最小值、平均值、最大值 {代码...} 使用stats得到统计值 {代码...} 分桶聚合 对员工的工种进行分桶 {代码...} 使用cardinality得到分桶数量 {代码...} 找到不同工种年龄最大的3个员工的信息 {代码...} Range分桶 {代码...} Histogram 分桶 {代码...} 嵌套分桶 {代...

ElasticSearch Hot&Warm架构

2019-09-23
阅读 2 分钟
1.9k
ElasticSearch Hot&Warm架构 数据通常不会有Update操作; 适⽤于Time based索引数据(生命周期管理),同时数据量⽐较大的场景。 引⼊Warm节点,低配置大容量的机器存放老数据,以降低部署成本 两类数据节点, 不同的硬件配置 Hot 节点(通常使用 SSD):索引有不断有新⽂档写入。通常使用 SSD Warm 节点(通常使用 H...

ElasticSearch集群部署方式

2019-09-20
阅读 1 分钟
2.5k
ElasticSearch集群部署方式 节点类型 生产环境中建议节点单一职责 Master eligible(使⽤低配置的 CPU,RAM 和磁盘) 负责集群状态管理 Data(使⽤高配置的 CPU, RAM 和磁盘) 负责数据存储及处理理客户端请求 Ingest(使⽤高配置 CPU;中等配置的RAM; 低配置的磁盘) 负责数据处理理 Coordinating(使⽤中配置/高配置 ...

ElasticSearch分页与深度分页问题解决

2019-09-16
阅读 4 分钟
13.6k
ElasticSearch分页与深度分页问题解决 ElasticSearch分页 {代码...} 这是ElasticSearch最简单的分页查询,但以上命令是会报错的。 报错信息,指window默认是10000。 {代码...} 怎么解决这个问题,首先能想到的就是调大这个window。 {代码...} 但这种方法只是暂时解决问题,当数据量越来越大,分页也越来越深,还是会出问...

ElasticSearch分片定位与内部原理

2019-09-10
阅读 3 分钟
3.8k
ElasticSearch分片定位与内部原理 路由文档到一个分片 文档会被存储到一个主分片中。Elasticsearch是如何知道一个文档应该存放到哪个分片中呢? 实际上,这个过程是根据下面这个公式决定的: shard = hash(routing) % number_of_primary_shards routing 是一个可变值,默认是文档的 _id ,也可以设置成一个自定义的值。 ...

ElasticSearch跨集群搜索

2019-09-05
阅读 3 分钟
5.1k
ElasticSearch跨集群搜索 水平扩展痛点 当水平扩展时,节点数不能无限增加。 因为当集群的meta信息(节点,索引,集群状态)过多,会导致更新压力变大。 单个Active Master会成为性能瓶颈,导致整个集群无法正常工作。 跨集群搜索Cross Cluster Search 早期版本是通过Tribe Node实现多集群访问需求,但存在一定问题,现...

ElasticSearch搜索建议与上下文提示

2019-09-03
阅读 6 分钟
9.9k
ElasticSearch搜索建议与上下文提示 搜索建议 通过Suggester Api实现 原理是将输入的文本分解为Token,然后在词典中查找类似的Term返回 根据不同场景,ElasticSearch设计了4中类别的Suggesters。 Term Suggester Phrase Suggester Complete Suggester Context Suggester Term Suggester 类似Google搜索引擎,我给的是一...

ElasticSearch这些概念要明白

2019-08-29
阅读 2 分钟
2k
ElasticSearch 基本概念 文档(Document) ElasticSearch是面向文档的,文档是可搜索的最小单位。 好比 日志文件中的日志 MP3播放的一首歌 文档会被序列化成JSON格式,保存在ElasticSearch中每个文档都有一个Unique ID 你可以自己制定ID 或者ElasticSearch自动生成。 文档元数据 元数据用于标注文档的相关信息 _index: ...

使用docker启动elasticsearch,kibana,cerebro

2019-08-19
阅读 4 分钟
5.2k
使用docker启动elasticsearch,kibana,cerebro 卸载旧版本docker 较旧版本的Docker被称为docker或docker-engine。如果已安装这些,请卸载它们以及相关的依赖项。 {代码...} 保留/var/lib/docker/的内容,包括图像,容器,卷和网络。Docker Engine - 社区包现在称为docker-ce。 安装docker 您可以根据需要以不同方式安装Do...

Elasticsearch学习笔记(入个门)

2019-07-25
阅读 7 分钟
2.5k
Elasticsearch学习笔记(入个门) 7.2.0版本 Elasticsearch安装启动 单实例 跟大部分开源产品一样,下载一个压缩包,解压缩就可用了。 解压后的文件目录说明 启动 bin/elasticsearch -E node.name=node1 -E cluster.name=ljktest -E path.data=node1_data 验证 浏览器输入localhost:9200 {代码...} 到此安装成功了 安装...